Sunteți pe pagina 1din 1748

Talend Open Studio

Guide de rfrence des Composants

5.0_a

Talend Open Studio

Talend Open Studio : Guide de rfrence des Composants


Convient pour lutilisation de Talend Open Studio v5.0.x. Annule et remplace toute version antrieure du Guide de rfrence.

Copyleft
Cette documentation est mise disposition selon les termes du Contrat Public Creative Commons (CPCC). Pour plus dinformations concernant votre utilisation de cette documentation en accord avec le Contrat CPCC, consultez : http:// creativecommons.org/licenses/by-nc-sa/2.0/

Table des matires


Prface .......................................... xxv
Informations gnrales ................ xxv Objectif .............................. xxv Public vis .......................... xxv Conventions typographiques ......................................... xxv Historique des versions ............... xxvi Remarques et Support ............... xxvi

Composants Business ...................... 1


tAlfrescoOutput ............................. 2 Proprits du tAlfrescoOutput ............................................. 2 Scnario : Crer des documents sur un serveur Alfresco ............................................. 7 tBonitaDeploy .............................. 12 Proprits du tBonitaDeploy ........................................... 12 Scnario associ .................... 13 tBonitaInstantiateProcess .............. 14 tBonitaInstantiateProcess Properties ............................. 14 Scnario : Excuter un processus Bonita via un Job Talend .................................... 15 tCentricCRMInput ....................... 20 Proprits du tCentricCRMInput ............................ 20 Scnario associ .................... 20 tCentricCRMOutput .................... 21 Proprits du tCentricCRMOutput .............................. 21 Scnario associ .................... 21 tHL7Input ................................... 22 Proprits du tHL7Input .......... 22 Scnario : Retrouver des informations concernant les patients et les vnements partir dun fichier HL7 ................ 23 tHL7Output ................................ 26 Proprits du tHL7Output ........ 26 Scnario associ .................... 26 tMarketoInput ............................. 27 Proprits du tMarketoInput ........................................... 27 Scnario associ .................... 29 tMarketoListOperation ................. 30 Proprits du tMarketoOutput ........................................... 30 Scnario : Ajouter un enregistrement de prospects dans une liste de la base de donnes Marketo ............................... 31 tMarketoOutput .......................... 35

Proprits du tMarketoOutput ........................................... 35 Scnario : Insrer et rcuprer des donnes dune base de donnes Marketo via un systme externe ......................... 37 tMicrosoftCRMInput ................... 41 Proprits du tMicrosoftCRMInput ............................ 41 Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques ........................................... 42 tMicrosoftCRMOutput ................. 49 Proprits du tMicrosoftCRMOutput .............................. 49 Scnario associ .................... 50 tMSAXInput ............................... 51 Proprits du tMSAXInput ....... 51 Scnario associ .................... 51 tMSAXOutput ............................. 52 Proprits du tMSAXOutput ........................................... 52 Scnario : Insrer des donnes dans une table dfinie sur le serveur Microsoft AX..... 54 Scnario 2 : Effacer des donnes dune table prcise sur le serveur MicrosoftAX. ............. 56 tOpenbravoERPInput ................... 59 Proprits du tOpenbravoERPInput .......................... 59 Scnario associ .................... 60 tOpenbravoERPOutput ................ 61 Proprits du tOpenbravoERPOutput ............................... 61 Scnario associ .................... 61 tSageX3Input .............................. 62 Proprits du tSageX3Input ...... 62 Scnario : Utiliser les cls des requtes pour extraire des donnes dun systme Sage X3 donn ............................. 63 tSageX3Output ............................ 67 Proprits du tSageX3Output ........................................... 67 Scnario : Utiliser un service Web Sage X3 pour insrer des donnes dans un systme Sage X3 donn ...................... 68 tSalesforceBulkExec ..................... 72 Proprits du tSalesforceBulkExec .................................. 72 Scnario associ .................... 73 tSalesforceConnection ................... 74

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Proprits du tSalesforceConnection ................................ 74 Scnario associ .................... 74 tSalesforceGetDeleted ................... 75 Proprits du tSalesforceGetDeleted ................................ 75 Scnario : Rcuprer les donnes supprimes du serveur Salesforce ............................ 76 tSalesforceGetServerTimestamp . 79 Proprits du tSalesforceGetServerTimestamp .............. 79 Scnario associ .................... 80 tSalesforceGetUpdated ................. 81 Proprits du tSalesforceGetUpdated .............................. 81 Scnario associ .................... 82 tSalesforceInput ........................... 83 Proprits du tSalesforceInput ...................................... 83 Scnario : Utiliser des requtes pour extraire des donnes dune base de donnes Salesforce ............................ 85 tSalesforceOutput ........................ 89 Proprits du tSalesforceOutput ...................................... 89 Scnario : Supprimer des donnes de lobjet Account ...... 91 tSalesforceOutputBulk .................. 93 Proprits du tSalesforceOutputBulk ............................... 93 Scnario : Insrer des donnes de masse transformes dans votre Salesforce.com ........ 93 tSalesforceOutputBulkExec ........... 98 Proprits du tSalesforceOutputBulkExec ......................... 98 Scnario : Insrer des donnes de masse dans votre Salesforce.com ...................... 99 tSAPCommit ............................. 103 Proprits du tSAPCommit ..... 103 Scnario associ .................. 103 tSAPConnection ......................... 104 Proprits du tSAPConnection ................................... 104 Scnario associ .................. 104 tSAPInput ................................. 105 Proprits du tSAPInput ........ 105 Scnario 1 : Rcuprer les mtadonnes dun systme SAP .................................. 107 Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE ........... 113

tSAPOutput ............................... 119 Proprits du tSAPOutput ...... 119 Scnarios associs ................ 120 tSAPRollback ............................ 121 Proprits du tSAPRollback ... 121 Scnario associ .................. 121 tSugarCRMInput ....................... 122 Proprits du tSugarCRMInput .................................... 122 Scnario: Extraire les donnes dun compte partir de SugarCRM ......................... 122 tSugarCRMOutput ..................... 125 Proprits du tSugarCRMOutput ............................ 125 Scnario associ .................. 126 tVtigerCRMInput ....................... 127 Proprits du tVtigerCRMInput .................................... 127 Scnario associ .................. 128 tVtigerCRMOutput .................... 129 Proprits du tVtigerCRMOutput ............................ 129 Scnario associ .................. 130

Composants Business Intelligence ............................................. 131


tBarChart ................................. 132 Proprits du tBarChart ......... 132 Scnario : Crer un diagramme en barres partir de donnes dentre .................. 133 tDB2SCD .................................. 139 Proprits du tDB2SCD ......... 139 Scnario associ .................. 140 tDB2SCDELT ............................ 141 Proprits du tDB2SCDELT ......................................... 141 Scnario associ .................. 143 tGreenplumSCD ......................... 144 Proprits du tGreenplumSCD ........................... 144 Scnario associ .................. 145 tInformixSCD ............................ 146 Proprits du tInformixSCD ......................................... 146 Scnario associ .................. 147 tIngresSCD ................................ 148 Proprits du tIngresSCD ....... 148 Scnario associ .................. 149 tJasperOutput ............................ 150 Proprits du tJasperOutput .... 150 Scnario : Gnrer un rapport avec un modle .jrxml ........... 151 tJasperOutputExec ..................... 153 Proprits du tJasperOutputExec ................................. 153 Scnario associ .................. 153

iv

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

tLineChart ................................ 154 Proprits du tLineChart ........ 154 Scnario : Crer un graphique en lignes afin de faciliter lanalyse des tendances ......... 155 tMondrianInput ......................... 161 Proprits du tMondrianInput ......................................... 161 Scnario : Tables en jointure croise ............................... 162 tMSSqlSCD ............................... 165 Proprits du tMSSqlSCD ...... 165 Scnario associ .................. 166 tMysqlSCD ................................ 167 Proprits du tMysqlSCD ....... 167 Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 ........................... 171 tMysqlSCDELT ......................... 178 Proprits du tMysqlSCDELT ................................ 178 Scnario associ .................. 180 tOracleSCD ............................... 181 Proprits du tOracleSCD ...... 181 Scnario associ .................. 182 tOracleSCDELT ......................... 183 Proprits du tOracleSCDELT ................................ 183 Scnario associ .................. 185 tPaloCheckElements ................... 186 Proprits du tPaloCheckElements ................................ 186 Scnario associ .................. 188 tPaloConnection ......................... 189 Proprits du tPaloConnection ................................... 189 Scnario associ .................. 189 tPaloCube ................................. 190 Proprits du tPaloCube ........ 190 Scnario : Crer un cube dans une base de donnes existante ......................................... 192 tPaloCubeList ............................ 194 Proprits du tPaloCubeList ... 194 Dcouvrir le schma de sortie en lecture seule du tPaloCubeList ................................ 195 Scnario : Rcuprer des informations dtailles dun cube dune base de donnes dtermine .......................... 196 tPaloDatabase ............................ 198 Proprits du tPaloDatabase ... 198 Scnario : Crer une base de donnes .............................. 199 tPaloDatabaseList ....................... 201

Proprits du tPaloDatabaseList ................................... 201 Dcouvrir le schma de sortie en lecture seule du tPaloDatabaseList ............................. 202 Scnario : Rcuprer des informations dtailles concernant les bases de donnes dun serveur Palo donn ........ 203 tPaloDimension .......................... 205 Proprits du tPaloDimension ......................................... 205 Scnario : Crer une dimension avec des lments .......... 209 tPaloDimensionList ..................... 214 Proprits du tPaloDimensionList .............................. 214 Dcouvrir le schma de sortie en lecture seule du tPaloDimensionList ..................... 216 Scnario: Rcuprer des informations dtailles concernant les dimensions dune base de donnes dtermine.... 216 tPaloInputMulti ......................... 218 Proprits du tPaloInputMulti ......................................... 218 Scnario : Rcuprer des lments de dimensions dans un cube donn ......................... 220 tPaloOutput ............................... 223 Proprits du tPaloOutput ...... 223 Scnario associ .................. 224 tPaloOutputMulti ....................... 225 Proprits du tPaloOutputMulti ................................. 225 Scnario 1 : Ecrire des donnes dans un cube donn ........ 227 Scnario 2 : Refuser un flux de donnes dentre lorsque les lments crire nexistent pas dans un cube donn ................................ 229 tPaloRule .................................. 233 Proprits du tPaloRule ......... 233 Scnario : Crer une rgle dans un cube donn .............. 234 tPaloRuleList ............................. 237 Proprits du tPaloRuleList .... 237 Dcouvrir le schma de sortie en lecture seule du tPaloRuleList ................................... 238 Scnario : Rcuprer des informations dtailles concernant des rgles dun cube donn ................................ 239 tParAccelSCD ............................ 241

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Proprits du tParAccelSCD ......................................... 241 Scnario associ .................. 242 tPostgresPlusSCD ....................... 243 Proprits du tPostgresPlusSCD ............................ 243 Scnario associ .................. 244 tPostgresPlusSCDELT ................ 245 Proprits du tPostgresPlusSCDELT ...................... 245 Scnario associ .................. 247 tPostgresqlSCD .......................... 248 Proprits du tPostgresqlSCD ......................................... 248 Scnario associ .................. 249 tPostgresqlSCDELT ................... 250 Proprits du tPostgresqlSCDELT ................................ 250 Scnario associ .................. 252 tSPSSInput ................................ 253 Proprits du tSPSSInput ....... 253 Scnario : Afficher le contenu dun fichier SPSS ................. 253 tSPSSOutput ............................. 256 Proprits du tSPSSOutput ..... 256 Scnario : Ecrire des donnes dans un fichier .sav ............... 256 tSPSSProperties ......................... 259 Proprits du tSPSSProperties .................................... 259 Scnario associ .................. 259 tSPSSStructure .......................... 260 Proprits du tSPSSStructure ......................................... 260 Scnario associ .................. 260 tSybaseSCD ............................... 261 Proprits du tSybaseSCD ...... 261 Scnario associ .................. 262 tSybaseSCDELT ........................ 263 Proprits du tSybaseSCDELT ................................ 263 Scnario associ .................. 265

Composants Cloud ....................... 267


tAmazonMysqlClose ................... Proprits du tAmazonMysqlClose .............................. Scnario associ .................. tAmazonMysqlCommit ............... Proprits du tAmazonMysqlCommit ........................... Scnario associ .................. tAmazonMysqlConnection ........... Proprits du tAmazonMysqlConnection ....................... Scnario associ .................. tAmazonMysqlInput ................... 268 268 268 269 269 269 270 270 270 271

Proprits du tAmazonMysqlInput ............................... Scnarios associs ................ tAmazonMysqlOutput ................. Proprits du tAmazonMysqlOutput .............................. Scnarios associs ................ tAmazonMysqlRollback .............. Proprits du tAmazonMysqlRollback .......................... Scnario associ .................. tAmazonMysqlRow .................... Proprits du tAmazonMysqlRow ................................ Scnarios associs ................ tAmazonOracleClose .................. Proprits du tAmazonOracleClose ............................. Scnario associ .................. tAmazonOracleCommit ............... Proprits du tAmazonOracleCommit .......................... Scnario associ .................. tAmazonOracleConnection .......... Proprits du tAmazonOracleConnection ..................... Scnario associ .................. tAmazonOracleInput .................. Proprits du tAmazonOracleInput .............................. Scnarios associs ................ tAmazonOracleOutput ................ Proprits du tAmazonOracleOutput ........................... Scnarios associs ................ tAmazonOracleRollback ............. Proprits du tAmazonOracleRollback ......................... Scnario associ .................. tAmazonOracleRow .................... Proprits du tAmazonOracleRow .............................. Scnarios associs ................ tMarketoInput ........................... tMarketoListOperation ............... tMarketoOutput ......................... tSalesforceBulkExec ................... tSalesforceConnection ................. tSalesforceGetDeleted ................. tSalesforceGetServerTimestamp . 302 tSalesforceGetUpdated ................ tSalesforceInput ......................... tSalesforceOutput ....................... tSalesforceOutputBulk ................ tSalesforceOutputBulkExec ......... tSugarCRMInput ....................... tSugarCRMOutput .....................

271 272 273 273 277 278 278 278 279 279 281 282 282 282 283 283 283 284 284 285 286 286 287 288 288 291 292 292 292 293 293 295 296 297 298 299 300 301

303 304 305 306 307 308 309

vi

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Composants Custom Code .......... 311


tGroovy ..................................... 312 Proprits du tGroovy ........... 312 Scnarios associs ................ 312 tGroovyFile ............................... 313 Proprits du tGroovyFile ...... 313 Scnario : Appeler du code Groovy contenu dans un fichier .................................. 313 tJava ......................................... 315 Proprits du tJava ............... 315 Scnario : Imprimer le contenu dune variable ................. 315 tJavaFlex ................................... 318 Proprits du tJavaFlex ......... 318 Scnario 1 : Gnrer un flux de donnes ......................... 319 Scnario 2 : Traiter des lignes de donnes avec le tJavaFlex ......................................... 321 tJavaRow .................................. 324 Proprits du tJavaRow ......... 324 Scnario associ .................. 324 tLibraryLoad ............................. 325 Proprits du tLibraryLoad ..... 325 Scnario : Vrifier le format dune adresse e-mail ............. 325 tSetGlobalVar ............................ 327 Proprits du tSetGlobalVar ......................................... 327 Scnario : Afficher le contenu dune variable globale ........... 327

Scnario : Remplacement partir dun fichier de rfrence ................................. tSchemaComplianceCheck ........... Proprits du tSchemaComplianceCheck ...................... Scnario : Valider les dates en fonction dun schma ........ tUniqRow .................................. Proprits du tUniqRow ........ Scnario : Ddoublonner des donnes ..............................

344 347 347 348 353 353 354

Composants Databases ................ 357


tAccessBulkExec ........................ 358 Proprits du tAccessBulkExec ................................ 358 Scnarios associs ................ 360 tAccessCommit .......................... 361 Proprits du tAccessCommit ......................................... 361 Scnario associ .................. 361 tAccessConnection ...................... 362 Proprits du tAccessConnection ................................... 362 Scnario: Insrer des donnes dans des tables parent/enfant ......................................... 362 tAccessInput .............................. 366 Proprits du tAccessInput ..... 366 Scnarios associs ................ 367 tAccessOutput ............................ 368 Proprits du tAccessOutput ......................................... 368 Scnarios associs ................ 371 tAccessOutputBulk ..................... 372 Proprits du tAccessOutputBulk .................................. 372 Scnarios associs ................ 373 tAccessOutputBulkExec .............. 374 Proprits du tAccessOutputBulkExec ........................... 374 Scnarios associs ................ 376 tAccessRollback ......................... 377 Proprits du tAccessRollback .................................. 377 Scnario associ .................. 377 tAccessRow ............................... 378 Proprits du tAccessRow ...... 378 Scnarios associs ................ 380 tAS400Close .............................. 381 Proprits du tAS400Close ..... 381 Scnario associ .................. 381 tAS400Commit ........................... 382 Proprits du tAS400Commit ......................................... 382 Scnario associ .................. 382 tAS400Connection ...................... 383

Composants Data Quality ........... 329


tAddCRCRow ............................ 330 Proprits du tAddCRCRow ......................................... 330 Scnario : Ajouter une cl de substitution un fichier ......... 330 tChangeFileEncoding .................. 333 tExtractRegexFields .................... 334 tFuzzyMatch .............................. 335 Proprits du tFuzzyMatch ..... 335 Scnario 1 : Distance de Levenshtein de 0 pour les prnoms ................................. 336 Scnario 2 : Distance de Levenshtein de 1 ou 2 pour les prnoms ............................. 338 Scnario 3 : Distance mtaphonique pour les prnoms ..... 339 tIntervalMatch ........................... 340 Proprits du tIntervalMatch ......................................... 340 Scnario : Identifier le pays partir de lIP ....................... 340 tReplaceList ............................... 343 Proprits du tReplaceList ...... 343

Guide de Rfrence des Composants Talend Open Studio

vii

Talend Open Studio

Proprits du tAS400Connection ............... 383 Scnario associ .................. 384 tAS400Input .............................. 385 Proprits du tAS400Input ..... 385 Scnarios associs ................ 386 tAS400LastInsertId .................... 387 Proprits du tAS400LastInsertId .............. 387 Scnario associ .................. 387 tAS400Output ............................ 388 Proprits du tAS400Output ......................................... 388 Scnarios associs ................ 391 tAS400Rollback ......................... 392 Proprits du tAS400Rollback .................. 392 Scnario associ .................. 392 tAS400Row ................................ 393 Proprits du tAS400Row ...... 393 Scnarios associs ................ 395 tCreateTable .............................. 396 Proprits du tCreateTable ..... 396 Scnario : Crer une nouvelle table dans une base de donnes MySQL ....................... 399 tDB2BulkExec ........................... 401 Proprits du tDB2BulkExec ......................................... 401 Scnario associ .................. 403 tDB2Close ................................. 404 Proprits du tDB2Close ........ 404 Scnario associ .................. 404 tDB2Commit ............................. 405 Proprits du tDB2Commit .... 405 Scnario associ .................. 405 tDB2Connection ......................... 406 Proprits du tDB2Connection .................. 406 Scnarios associs ................ 407 tDB2Input ................................. 408 Proprits du tDB2Input ........ 408 Scnarios associs ................ 409 tDB2Output ............................... 410 Proprits du tDB2Output ...... 410 Scnarios associs ................ 413 tDB2Rollback ............................ 414 Proprits du tDB2Rollback ......................................... 414 Scnario associ .................. 414 tDB2Row ................................... 415 Proprits du tDB2Row ......... 415 Scnarios associs ................ 417 tDB2SCD .................................. 418 tDB2SCDELT ............................ 419 tDB2SP ..................................... 420 Proprits du tDB2SP ........... 420 Scnario associ .................. 421

tDBInput ................................... 422 Proprits du tDBInput .......... 422 Scnario 1 : Afficher les donnes slectionnes partir dune table ......................... 423 Scnario 2 : Utiliser la variable StoreSQLQuery ........... 424 tDBOutput ................................ 426 Proprits du tDBOutput ........ 426 Scnario : Afficher la base de donnes en sortie ................. 428 tDBSQLRow .............................. 430 Proprits du tDBSQLRow .... 430 Scnario : Rinitialiser lauto-incrmentation dune base de donnes ................... 431 tEXAInput ................................ 433 Proprits du tEXAInput ........ 433 Scnarios associs ................ 434 tEXAOutput .............................. 435 Proprits du tEXAOutput ..... 435 Scnarios associs ................ 437 tEXARow .................................. 438 Proprits du tEXARow ........ 438 Scnarios associs ................ 439 tEXistConnection ....................... 440 Proprits du tEXistConnection ................................... 440 Scnario associ .................. 440 tEXistDelete ............................... 441 Proprits du tEXistDelete ..... 441 Scnario associ .................. 442 tEXistGet .................................. 443 Proprits du tEXistGet ......... 443 Scnario : Rcuprer des ressources partir dun serveur distant de base de donnes eXist ................................. 444 tEXistList .................................. 447 Proprits du tEXistList ......... 447 Scnario associ .................. 448 tEXistPut .................................. 449 Proprits du tEXistPut ......... 449 Scnario associ .................. 450 tEXistXQuery ............................ 451 Proprits du tEXistXQuery ......................................... 451 Scnario associ .................. 452 tEXistXUpdate ........................... 453 Proprits du tEXistXUpdate ......................................... 453 Scnario associ .................. 454 tFirebirdClose ............................ 455 Proprits du tFirebirdClose ......................................... 455 Scnario associ .................. 455 tFirebirdCommit ........................ 456

viii

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Proprits du tFirebirdCommit .................................... 456 Scnario associ .................. 456 tFirebirdConnection ................... 457 Proprits du tFirebirdConnection ............................... 457 Scnario associ .................. 458 tFirebirdInput ........................... 459 Proprits du tFirebirdInput .... 459 Scnarios associs ................ 460 tFirebirdOutput ......................... 461 Proprits du tFirebirdOutput ......................................... 461 Scnarios associs ................ 463 tFirebirdRollback ....................... 464 Proprits du tFirebirdRollback .................................. 464 Scnario associ .................. 464 tFirebirdRow ............................. 465 Proprits du tFirebirdRow ..... 465 Scnarios associs ................ 467 tGreenplumBulkExec .................. 468 Proprits du tGreenplumBulkExec ........................... 468 Scnarios associs ................ 470 tGreenplumClose ....................... 471 Proprits du tGreenplumClose ................................. 471 Scnario associ .................. 471 tGreenplumCommit .................... 472 Proprits du tGreenplumCommit .............................. 472 Scnario associ .................. 472 tGreenplumConnection ............... 473 Proprits du tGreenplumConnection ......................... 473 Scnarios associs ................ 474 tGreenplumInput ....................... 475 Proprits du tGreenplumInput .................................... 475 Scnarios associs ................ 476 tGreenplumGPLoad ................... 477 Proprits du tGreenplumGPLoad ................................ 477 Scnario associ .................. 481 tGreenplumOutput ..................... 482 Proprits du tGreenplumOutput ............................. 482 Scnarios associs ................ 484 tGreenplumOutputBulk .............. 486 Proprits du tGreenplumOutputBulk ...................... 486 Scnarios associs ................ 487 tGreenplumOutputBulkExec ........ 488 Proprits du tGreenplumOutputBulkExec ................ 488 Scnarios associs ................ 489 tGreenplumRollback ................... 490

Proprits du tGreenplumRollback ............................ Scnario associ .................. tGreenplumRow ......................... Proprits du tGreenplumRow .................................. Scnarios associs ................ tGreenplumSCD ......................... tHiveClose ................................. Proprits du tHiveClose ....... Scnario associ .................. tHiveConnection ......................... Proprits du tHiveConnection ................................... Scnarios associs ................ tHiveRow .................................. Proprits du tHiveRow ......... Scnarios associs ................ tHSQLDbInput .......................... Proprits du tHSQLDbInput ......................................... Scnarios associs ................ tHSQLDbOutput ........................ Proprits du tHSQLDbOutput .................................... Scnarios associs ................ tHSQLDbRow ........................... Proprits du tHSQLDbRow ......................................... Scnarios associs ................ tInformixBulkExec ..................... Proprits du tInformixBulkExec ................................ Scnario associ .................. tInformixClose ........................... Proprits du tInformixClose ......................................... Scnario associ .................. tInformixCommit ....................... Proprits du tInformixCommit .................................... Scnario associ .................. tInformixConnection ................... Proprits du tInformixConnection ............................... Scnarios associs ................ tInformixInput ........................... Proprits du tInformixInput ......................................... Scnarios associs ................ tInformixOutput ........................ Proprits du tInformixOutput .................................... Scnarios associs ................ tInformixOutputBulk .................. Proprits du tInformixOutputBulk .............................. Scnarios associs ................

490 490 491 491 493 494 495 495 495 496 496 496 497 497 498 499 499 501 502 502 505 507 507 509 510 510 512 513 513 513 514 514 514 515 515 516 517 517 518 519 519 521 523 523 524

Guide de Rfrence des Composants Talend Open Studio

ix

Talend Open Studio

tInformixOutputBulkExec ........... 525 Proprits du tInformixOutputBulkExec ....................... 525 Scnarios associs ................ 527 tInformixRollback ...................... 528 Proprits du tInformixRollback .................................. 528 Scnario associ .................. 528 tInformixRow ............................ 529 Proprits du tInformixRow ... 529 Scnarios associs ................ 531 tInformixSCD ............................ 532 tInformixSP ............................... 533 Proprits du tInformixSP ...... 533 Scnarios associs ................ 535 tIngresClose ............................... 536 Proprits du tIngresClose ...... 536 Scnario associ .................. 536 tIngresCommit ........................... 537 Proprits du tIngresCommit ......................................... 537 Scnario associ .................. 537 tIngresConnection ...................... 538 Proprits du tIngresConnection ................................... 538 Scnario associ .................. 538 tIngresInput .............................. 539 Proprits du tIngresInput ...... 539 Scnarios associs ................ 540 tIngresOutput ............................ 541 Proprits du tIngresOutput .... 541 Scnarios associs ................ 543 tIngresRollback .......................... 544 Proprits du tIngresRollback ......................................... 544 Scnario associ .................. 544 tIngresRow ................................ 545 Proprits du tIngresRow ....... 545 Scnarios associs ................ 546 tIngresSCD ................................ 547 tInterbaseClose .......................... 548 Proprits du tInterbaseClose ......................................... 548 Scnario associ .................. 548 tInterbaseCommit ...................... 549 Proprits du tInterbaseCommit .................................... 549 Scnario associ .................. 549 tInterbaseConnection .................. 550 Proprits du tInterbaseConnection ............................... 550 Scnarios associs ................ 550 tInterbaseInput .......................... 551 Proprits du tInterbaseInput ......................................... 551 Scnarios associs ................ 552 tInterbaseOutput ........................ 553

Proprits du tInterbaseOutput .................................... 553 Scnarios associs ................ 555 tInterbaseRollback ..................... 556 Proprits du tInterbaseRollback .................................. 556 Scnario associ .................. 556 tInterbaseRow ........................... 557 Proprits du tInterbaseRow ......................................... 557 Scnarios associs ................ 559 tJavaDBInput ............................ 560 Proprits du tJavaDBInput .... 560 Scnarios associs ................ 561 tJavaDBOutput .......................... 562 Proprits du tJavaDBOutput ......................................... 562 Scnarios associs ................ 564 tJavaDBRow .............................. 565 Proprits du tJavaDBRow ..... 565 Scnarios associs ................ 566 tJDBCColumnList ...................... 567 Proprits du tJDBCColumnList ................................... 567 Scnario associ .................. 567 tJDBCClose ............................... 568 Proprits du tJDBCClose ...... 568 Scnario associ .................. 568 tJDBCCommit ........................... 569 Proprits du tJDBCCommit ......................................... 569 Scnario associ .................. 569 tJDBCConnection ....................... 570 Proprits du tJDBCConnection ................................... 570 Scnario associ .................. 571 tJDBCInput ............................... 572 Proprits du tJDBCInput ...... 572 Scnarios associs ................ 573 tJDBCOutput ............................ 575 Proprits du tJDBCOutput .... 575 Scnarios associs ................ 577 tJDBCRollback .......................... 579 Proprits du tJDBCRollback ......................................... 579 Scnario associ .................. 579 tJDBCRow ................................ 580 Proprits du tJDBCRow ....... 580 Scnarios associs ................ 582 tJDBCSP ................................... 583 Proprits du tJDBCSP ......... 583 Scnarios associs ................ 584 tJDBCTableList ......................... 585 Proprits du tJDBCTableList ................................... 585 Scnario associ .................. 585 tLDAPAttributesInput ................ 586

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Proprits du tLDAPAttributesInput .............................. 586 Scnario associ .................. 588 tLDAPConnection ...................... 589 Proprits du tLDAPConnection ................................... 589 Scnario associ .................. 590 tLDAPInput .............................. 591 Proprits du tLDAPInput ...... 591 Scnario : Afficher le contenu filtr dun annuaire LDAP ...... 593 tLDAPOutput ............................ 595 Proprits du tLDAPOutput .... 595 Scnario : Editer des donnes dans un annuaire LDAP ......... 597 tLDAPRenameEntry ................... 600 Proprits du tLDAPRenameEntry ............................. 600 Scnarios associs ................ 601 tMaxDBInput ............................ 602 Proprits du tMaxDBInput .... 602 Scnarios associs ................ 603 tMaxDBOutput .......................... 604 Proprits du tMaxDBOutput ......................................... 604 Scnarios associs ................ 606 tMaxDBRow .............................. 607 Proprits du tMaxDBRow ..... 607 Scnarios associs ................ 608 tMSSqlBulkExec ........................ 609 Proprits du tMSSqlBulkExec ................................ 609 Scnarios associs ................ 611 tMSSqlClose .............................. 612 Proprits du tMSSqlClose ..... 612 Scnario associ .................. 612 tMSSqlColumnList ..................... 613 Proprits du tMSSqlColumnList ............................ 613 Scnario associ .................. 613 tMSSqlCommit .......................... 614 Proprits du tMSSqlCommit ......................................... 614 Scnario associ .................. 614 tMSSqlConnection ...................... 615 Proprits du tMSSqlConnection ................................... 615 Scnario associ .................. 616 tMSSqlInput .............................. 617 Proprits du tMSSqlInput ..... 617 Scnarios associs ................ 618 tMSSqlLastInsertId .................... 619 Proprits du tMSSqlLastInsertId ................................. 619 Scnario associ .................. 619 tMSSqlOutput ........................... 620 Proprits du tMSSqlOutput ......................................... 620

Scnarios associs ................ 624 tMSSqlOutputBulk ..................... 625 Proprits du tMSSqlOutputBulk .................................. 625 Scnarios associs ................ 626 tMSSqlOutputBulkExec .............. 627 Proprits du tMSSqlOutputBulkExec ........................... 627 Scnarios associs ................ 629 tMSSqlRollback ......................... 630 Proprits du tMSSqlRollback .................................. 630 Scnario associ ................... 630 tMSSqlRow ............................... 631 Proprits du tMSSqlRow ...... 631 Scnarios associs ................ 633 tMSSqlSCD ............................... 634 tMSSqlSP .................................. 635 Proprits du tMSSqlSP ........ 635 Scnarios associs ................ 636 tMSSqlTableList ........................ 638 Proprits du tMSSqlTableList ................................... 638 Scnario associ .................. 638 tMysqlBulkExec ......................... 639 Proprits du tMysqlBulkExec ................................ 639 Scnarios associs ................ 641 tMysqlClose ............................... 642 Proprits du tMysqlClose ..... 642 Scnario associ .................. 642 tMysqlColumnList ...................... 643 Proprits du tMysqlColumnList ................................... 643 Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table ......................................... 643 tMysqlCommit ........................... 646 Proprits du tMysqlCommit ......................................... 646 Scnario associ .................. 646 tMysqlConnection ...................... 647 Proprits du tMysqlConnection ................................... 647 Scnario : Insrer des donnes dans des tables mre/ fille ................................... 647 tMysqlInput ............................... 651 Proprits du tMysqlInput ...... 651 Scnario : Ecrire des colonnes dune base de donnes MySQL dans un fichier de sortie ................................. 652 tMysqlLastInsertId ..................... 656 Proprits du tMysqlLastInsertId ................................. 656

Guide de Rfrence des Composants Talend Open Studio

xi

Talend Open Studio

Scnario : Rcuprer les ID des dernires entres ajoutes ......................................... 656 tMysqlOutput ............................ 661 Proprits du tMysqlOutput .... 661 Scnario 1 : Ajouter une colonne et modifier les donnes ......................................... 665 Scnario 2 : Effectuer des mises jour dans une base de donnes .............................. 669 Scnario 3 : Rcuprer les donnes errones laide dun lien Reject ................... 672 tMysqlOutputBulk ..................... 677 Proprits du tMysqlOutputBulk .................................. 677 Scnario : Insrer des donnes transformes dans une base MySQL ....................... 678 tMysqlOutputBulkExec ............... 681 Proprits du tMysqlOutputBulkExec ........................... 681 Scnario : Insrer des donnes dans une base MySQL.... 683 tMysqlRollback .......................... 685 Proprits du tMysqlRollback ......................................... 685 Scnario : Annuler linsertion de donnes dans des tables mre/fille ............................ 685 tMysqlRow ................................ 686 Proprits du tMysqlRow ....... 686 Scnario 1 : Supprimer et regnrer un index de table MySQL .............................. 688 Scnario 2 : Utiliser linstance PreparedStatement pour faire une requte sur des donnes .............................. 689 tMysqlSCD ................................ 694 tMysqlSCDELT ......................... 695 tMysqlSP ................................... 696 Proprits du tMysqlSP ......... 696 Scnario : Trouver le libell State laide dune procdure stocke .............................. 697 tMysqlTableList ......................... 701 Proprits du tMysqlTableList ................................... 701 Scnario : Effectuer une opration ditration sur des tables et en effacer le contenu grce un modle SQL dfini par lutilisateur (SQL Template) ................................. 701 Scnario associ .................. 705 tNetezzaBulkExec ....................... 706

Proprits du tNetezzaBulkExec ................................ 706 Scnarios associs ................ 707 tNetezzaClose ............................. 709 Proprits du tNetezzaClose ......................................... 709 Scnario associ .................. 709 tNetezzaCommit ......................... 710 Proprits du tNetezzaCommit .................................... 710 Scnario associ .................. 710 tNetezzaConnection .................... 711 Proprits du tNetezzaConnection ............................... 711 Scnario associ .................. 711 tNetezzaInput ............................ 712 Proprits du tNetezzaInput .... 712 Scnarios associs ................ 713 tNetezzaNzLoad ......................... 714 Proprits du tNetezzaNzLoad .................................. 714 Scnario associ .................. 719 tNetezzaOutput .......................... 720 Proprits du tNetezzaOutput ......................................... 720 Scnarios associs ................ 723 tNetezzaRollback ........................ 724 Proprits du tNetezzaRollback .................................. 724 Scnario associ .................. 724 tNetezzaRow .............................. 725 Proprits du tNetezzaRow ..... 725 Scnario associ .................. 727 tOracleBulkExec ........................ 728 Proprits du tOracleBulkExec ................................ 728 Scnario : Supprimer et insrer des donnes dans une base Oracle ................................ 731 tOracleClose .............................. 734 Proprits du tOracleClose ..... 734 Scnario associ .................. 734 tOracleCommit .......................... 735 Proprits du tOracleCommit ......................................... 735 Scnario associ .................. 735 tOracleConnection ...................... 736 Proprits du tOracleConnection ................................... 736 Scnario associ .................. 737 tOracleInput .............................. 738 Proprits du tOracleInput ...... 738 Scnarios associs ................ 740 tOracleOutput ........................... 741 Proprits du tOracleOutput ... 741 Scnarios associs ................ 744 tOracleOutputBulk ..................... 746

xii

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Proprits du tOracleOutputBulk .................................. Scnarios associs ................ tOracleOutputBulkExec .............. Proprits du tOracleOutputBulkExec ........................... Scnarios associs ................ tOracleRollback ......................... Proprits du tOracleRollback .................................. Scnario associ .................. tOracleRow ............................... Proprits du tOracleRow ...... Scnario associ .................. tOracleSCD ............................... tOracleSCDELT ......................... tOracleSP .................................. Proprits du tOracleSP ......... Scnario : Vrifier le format de numros laide dune procdure stocke ................ tOracleTableList ........................ Proprits du tOracleTableList ................................... Scnario associ .................. tParAccelBulkExec ..................... Proprits du tParAccelBulkExec ................................ Scnarios associs ................ tParAccelClose ........................... Proprits du tParAccelClose ......................................... Scnario associ .................. tParAccelCommit ....................... Proprits du tParAccelCommit .................................... Scnario associ .................. tParAccelConnection .................. Proprits du tParAccelConnection ............................... Scnario associ .................. tParAccelInput ........................... Proprits du tParAccelInput ......................................... Scnarios associs ................ tParAccelOutput ........................ Proprits du tParAccelOutput .................................... Scnarios associs ................ tParAccelOutputBulk ................. Proprits du tParAccelOutputBulk .............................. Scnarios associs ................ tParAccelOutputBulkExec ........... Proprits du tParAccelOutputBulkExec ....................... Scnarios associs ................ tParAccelRollback ......................

746 747 748 748 751 753 753 753 754 754 756 757 758 759 759

762 766 766 766 767 767 769 770 770 770 771 771 771 772 772 773 774 774 775 776 776 778 780 780 781 782 782 783 785

Proprits du tParAccelRollback .................................. Scnario associ .................. tParAccelRow ............................ Proprits du tParAccelRow ......................................... Scnarios associs ................ tParAccelSCD ............................ tParseRecordSet ......................... Proprits du tParseRecordSet .............................. Scnario associ .................. tPostgresPlusBulkExec ................ Proprits du tPostgresPlusBulkExec ........................... Scnario associ .................. tPostgresPlusClose ...................... Proprits du tPostgresPlusClose ................................. Scnario associ .................. tPostgresPlusCommit .................. Proprits du tPostgresPlusCommit .............................. Scnario associ .................. tPostgresPlusConnection ............. Proprits du tPostgresPlusConnection ......................... Scnario associ .................. tPostgresPlusInput ..................... Proprits du tPostgresPlusInput ............................ Scnarios associs ................ tPostgresPlusOutput ................... Proprits du tPostgresPlusOutput .............................. Scnarios associs ................ tPostgresPlusOutputBulk ............ Proprits du tPostgresPlusOutputBulk ........................ Scnarios associs ................ tPostgresPlusOutputBulkExec ...... Proprits du tPostgresplusOutputBulkExec ................. Scnarios associs ................ tPostgresPlusRollback ................. Proprits du tPostgresPlusRollback ............................ Scnario associ .................. tPostgresPlusRow ....................... Proprits du tPostgresPlusRow .................................. Scnarios associs ................ tPostgresPlusSCD ....................... tPostgresPlusSCDELT ................ tPostgresqlBulkExec ................... Proprits du tPostgresqlBulkExec ................................ Scnarios associs ................

785 785 786 786 788 789 790 790 790 791 791 792 794 794 794 795 795 795 796 796 797 798 798 799 800 800 803 804 804 805 806 806 807 808 808 808 809 809 811 812 813 814 814 816

Guide de Rfrence des Composants Talend Open Studio

xiii

Talend Open Studio

tPostgresqlClose ......................... 817 Proprits du tPostgresqlClose ................................. 817 Scnario associ .................. 817 tPostgresqlCommit ..................... 818 Proprits du tPostgresqlCommit .............................. 818 Scnario associ .................. 818 tPostgresqlConnection ................. 819 Proprits du tPostgresqlConnection ............................... 819 Scnario associ .................. 820 tPostgresqlInput ......................... 821 Proprits du tPostgresqlInput .................................... 821 Scnarios associs ................ 822 tPostgresqlOutput ...................... 823 Proprits du tPostgresqlOutput .................................... 823 Scnarios associs ................ 826 tPostgresqlOutputBulk ................ 827 Proprits du tPostgresqlOutputBulk .............................. 827 Scnarios associs ............... 828 tPostgresqlOutputBulkExec ......... 829 Proprits du tPostgresqlOutputBulkExec ....................... 829 Scnarios associs ................ 830 tPostgresqlRollback .................... 832 Proprits du tPostgresqlRollback .................................. 832 Scnario associ .................. 832 tPostgresqlRow .......................... 833 Proprits du tPostgresqlRow ......................................... 833 Scnarios associs ................ 835 tPostgresqlSCD .......................... 836 tPostgresqlSCDELT ................... 837 tSASInput ................................. 838 Proprits du tSASInput ........ 838 Scnarios associs ................ 839 tSASOutput ............................... 840 Proprits du tSASOutput ...... 840 Scnarios associs ............... 842 tSQLiteClose ............................. 843 Proprits du tSQLiteClose .... 843 Scnario associ .................. 843 tSQLiteCommit .......................... 844 Proprits du tSQLiteCommit ......................................... 844 Scnario associ .................. 844 tSQLiteConnection ..................... 845 Proprits du tSQLiteConnection ............................... 845 Scnarios associs ................ 845 tSQLiteInput ............................. 846 Proprits du tSQLiteInput ..... 846

Scnario : Filtrer des donnes SQlite ................................ 847 tSQLiteOutput ........................... 850 Proprits du tSQLiteOutput ......................................... 850 Scnario associ .................. 852 tSQLiteRollback ......................... 853 Proprits du tSQLiteRollback .................................. 853 Scnario associ .................. 853 tSQLiteRow ............................... 854 Proprits du tSQLiteRow ...... 854 Scnario : Mettre jour des lignes SQLite ...................... 855 tSybaseBulkExec ........................ 858 Proprits du tSybaseBulkExec ................................ 858 Scnarios associs ................ 860 tSybaseClose .............................. 861 Proprits du tSybaseClose ..... 861 Scnario associ .................. 861 tSybaseCommit .......................... 862 Proprits du tSybaseCommit ......................................... 862 Scnario associ .................. 862 tSybaseConnection ..................... 863 Proprits du tSybaseConnection ................................... 863 Scnarios associs ................ 863 tSybaseInput .............................. 864 Proprits du tSybaseInput ..... 864 Scnario associ .................. 865 tSybaseIQBulkExec .................... 866 Proprits du tSybaseIQBulkExec ................................ 866 Scnario associ .................. 867 tSybaseIQOutputBulkExec .......... 869 Proprits du tSybaseIQOutputBulkExec ....................... 869 Scnarios associs ................ 871 tSybaseOutput ........................... 872 tSybaseOutput Properties ....... 872 Scnario associ .................. 875 tSybaseOutputBulk ..................... 876 Proprits du tSybaseOutputBulk .................................. 876 Scnario associ .................. 877 tSybaseOutputBulkExec .............. 878 Proprits du tSybaseOutputBulkExec ........................... 878 Scnarios associs ................ 880 tSybaseRollback ......................... 881 Proprits du tSybaseRollback .................................. 881 Scnario associ .................. 881 tSybaseRow ............................... 882 Proprits du tSybaseRow ...... 882 Scnario associ .................. 884

xiv

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

tSybaseSCD ............................... 885 tSybaseSCDELT ........................ 886 tSybaseSP .................................. 887 Proprits du tSybaseSP ........ 887 Scnario associ .................. 888 tTeradataClose ........................... 890 Proprits du tTeradataClose ......................................... 890 Scnario associ .................. 890 tTeradataCommit ....................... 891 Proprits du tTeradataCommit .................................... 891 Scnario associ .................. 891 tTeradataConnection .................. 892 Proprits du tTeradataConnection ............................... 892 Scnario associ .................. 893 tTeradataFastExport .................. 894 Proprits du tTeradataFastExport .............................. 894 Scnario associ .................. 895 tTeradataFastLoad ..................... 896 Proprits du tTeradataFastLoad .................................. 896 Scnario associ .................. 897 tTeradataFastLoadUtility ............ 898 Proprits du tTeradataFastLoadUtility ......................... 898 Scnario associ .................. 899 tTeradataInput .......................... 900 Proprits du tTeradataInput ......................................... 900 Scnario associ .................. 901 tTeradataMultiLoad ................... 902 Proprits du tTeradataMultiLoad .................................. 902 Scnario associ .................. 903 tTeradataOutput ........................ 904 Proprits du tTeradataOutput .................................... 904 Scnario associ ................. 907 tTeradataRollback ...................... 908 Proprits du tTeradataRollback .................................. 908 Scnario associ .................. 908 tTeradataRow ............................ 909 Proprits du tTeradataRow .... 909 Scnario associ .................. 911 tTeradataTPump ........................ 912 Proprits du tTeradataTPump ................................. 912 Scnario : Insrer des donnes dans une table dune base de donnes Teradata ....... 913 tVectorWiseCommit ................... 917 Proprits du tVectorWiseCommit .............................. 917 Scnario associ .................. 917

tVectorWiseConnection ............... 918 Proprits du tVectorWiseConnection ......................... 918 Scnario associ .................. 919 tVectorWiseInput ....................... 920 Proprits du tVectorWiseInput .................................... 920 Scnario associ .................. 921 tVectorWiseOutput ..................... 922 Proprits du tVectorWiseOutput ............................ 922 Scnario associ .................. 925 tVectorWiseRollback .................. 926 Proprits du tVectorWiseRollback ............................ 926 Scnario associ .................. 926 tVectorWiseRow ........................ 927 Proprits du tVectorWiseRow .................................. 927 Scnario associ .................. 929 tVerticaBulkExec ....................... 930 Proprits du tVerticaBulkExec ................................ 930 Scnarios associs ................ 932 tVerticaClose ............................. 933 Proprits du tVerticaClose .... 933 Scnario associ .................. 933 tVerticaCommit ......................... 934 Proprits du tVerticaCommit ......................................... 934 Scnario associ .................. 934 tVerticaConnection ..................... 935 Proprits du tVerticaConnection ............................... 935 Scnario associ .................. 936 tVerticaInput ............................. 937 Proprits du tVerticaInput ..... 937 Scnarios associs ................ 938 tVerticaOutput ........................... 939 Proprits du tVerticaOutput ......................................... 939 Scnarios associs ................ 943 tVerticaOutputBulk .................... 944 Proprits du tVerticaOutputBulk .................................. 944 Scnarios associs ................ 945 tVerticaOutputBulkExec ............. 946 Proprits du tVerticaOutputBulkExec ........................... 946 Scnarios associs ................ 947 tVerticaRollback ........................ 948 Proprits du tVerticaRollback .................................. 948 Scnario associ .................. 948 tVerticaRow .............................. 949 Proprits du tVerticaRow ..... 949 Scnario associ .................. 951

Guide de Rfrence des Composants Talend Open Studio

xv

Talend Open Studio

Composants ELT ......................... 953


tCombinedSQLAggregate ............ Proprits du tCombinedSQLAggregate ......................... Scnario : Filtrer et agrger des colonnes dune table directement sur le SGBD .......... tCombinedSQLFilter .................. Proprits du tCombinedSQLFilter ............................. Scnario associ .................. tCombinedSQLInput .................. Proprits du tCombinedSQLInput ............................. Scnario associ .................. tCombinedSQLOutput ................ Proprits du tCombinedSQLOutput ............................. Scnario associ .................. tELTJDBCInput ........................ Proprits de tELTJDBCInput .................................... Scnarios associs ................ tELTJDBCMap ......................... Proprits de tELTJDBCMap ......................................... Scnarios associs ................ tELTJDBCOutput ...................... Proprits de tELTJDBCOutput .................................... Scnarios associs ................ tELTMSSqlInput ....................... Proprits de tELTMSSqlInput .................................... Scnarios associs ................ tELTMSSqlMap ......................... Proprits de tELTMSSqlMap .................................. Scnarios associs ................ tELTMSSqlOutput ..................... Proprits de tELTMSSqlOutput .............................. Scnarios associs ................ tELTMysqlInput ........................ Proprits de tELTMysqlInput .................................... Scnarios associs ................ tELTMysqlMap ......................... Proprits de tELTMysqlMap ......................................... Scnario 1 : Agrger les colonnes dune table et appliquer un filtre ....................... Scnario 2 : ELT utilisant une table Alias .......................... tELTMysqlOutput ...................... 954 954

955 960 960 961 962 962 963 964 964 965 966 966 966 968 968 969 970 970 971 972 972 972 974 974 975 976 976 977 978 978 978 980 980

982 986 991

Proprits de tELTMysqlOutput .................................... 991 Scnarios associs ................ 992 tELTOracleInput ....................... 993 Proprits de tELTOracleInput .................................... 993 Scnario associ .................. 993 tELTOracleMap ......................... 994 Proprits de tELTOracleMap .................................. 994 Scnario : Mettre jour les lignes dune base Oracle ........ 996 tELTOracleOutput ..................... 999 Proprits de tELTOracleOutput ........................... 999 Scnario : Utiliser la fonction MERGE dOracle pour mettre jour et insrer simultanment des donnes .......... 1000 tELTPostgresqlInput ................. 1005 Proprits de tELTPostgresqlInput ............................. 1005 Scnarios associs .............. 1005 tELTPostgresqlMap .................. 1007 Proprits de tELTPostgresqlMap .............................. 1007 Scnarios associs .............. 1008 tELTPostgresqlOutput .............. 1009 Proprits de tELTPostgresqlOutput ............................. 1009 Scnarios associs .............. 1010 tELTSybaseInput ..................... 1011 Proprits de tELTSybaseInput .................................. 1011 Scnarios associs .............. 1011 tELTSybaseMap ....................... 1013 Proprits de tELTSybaseMap ................................. 1013 Scnarios associs .............. 1014 tELTSybaseOutput ................... 1015 Proprits de tELTSybaseOutput ........................... 1015 Scnarios associs .............. 1016 tELTTeradataInput .................. 1017 Proprits de tELTTeradataInput ............................. 1017 Scnarios associs .............. 1017 tELTTeradataMap ................... 1019 Proprits de tELTTeradataMap ................................. 1019 Scnarios associs .............. 1021 tELTTeradataOutput ................ 1022 Proprits de tELTTeradataOutput ........................... 1022 Scnarios associs .............. 1023 tSQLTemplateAggregate ........... 1024 Proprits du tSQLTemplateAggregate ....................... 1024

xvi

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD ...... tSQLTemplateCommit .............. Proprits du tSQLTemplateCommit ............................ Scnario associ ................. tSQLTemplateFilterColumns ..... Proprits du tSQLTemplateFilterColumns .................... Scnario associ ................. tSQLTemplateFilterRows .......... Proprits du tSQLTemplateFilterRows ........................ Scnario associ ................. tSQLTemplateMerge ................. Proprits du tSQLTemplateMerge .............................. Scnario : Effectuer des oprations de MERGE directement dans le SGBD ............ tSQLTemplateRollback ............. Proprits du tSQLTemplateRollback ........................... Scnario associ ................. tESBConsumer ......................... Proprits du tESBConsumer ........................................ Scnario : Retourner une adresse e-mail valide ........... tESBProviderFault ................... Proprits du tESBProviderFault ................................ Scnario : Retourner un message Fault ......................... tESBProviderRequest ................ Proprits du tESBProviderRequest ............................ Scnario : Envoi dun message via un service sans attente de rponse ................. tESBProviderResponse .............. Proprits du tESBProviderResponse .......................... Scnario : Retourner une rponse Hello world ........... tRESTRequest .......................... Proprits du tRESTRequest ........................................ Scnario : Envoi d'un message avec une rponse dans un service REST ................ tRESTResponse ........................ Proprits du tRESTResponse ............................... Scnario associ .................

Composants File ......................... 1097


1026 1030 1030 1031 1032 1032 1033 1034 1034 1035 1036 1036 tAdvancedFileOutputXML ........ 1098 tApacheLogInput ...................... 1099 Proprits du tApacheLogInput .................................. 1099 Scnario : Lire un fichier de log daccs Apache ............. 1100 tChangeFileEncoding ................ 1102 tChangeFileEncoding Properties .................................. 1102 Scnario: Transformer lencodage des caractres dun fichier ....................... 1102 tCreateTemporaryFile ............... 1104 Proprits du tCreateTemporaryFile ............................ 1104 Scnario : Crer un fichier temporaire et y crire des donnes ............................ 1105 tFileArchive ............................. 1109 Proprits du tFileArchive .... 1109 Scnario : Zipper des fichiers laide dun tFileArchive ..... 1110 tFileCompare ........................... 1112 Proprits du tFileCompare ... 1112 Scnario : Comparer des fichiers dzipps .................. 1113 tFileCopy ................................. 1115 Proprits du tFileCopy ....... 1115 Scnario : Rcuprer un fichier de la corbeille ............ 1116 tFileDelete ............................... 1118 Proprits du tFileDelete ...... 1118 Scnario : Supprimer des fichiers ............................... 1119 tFileExist ................................. 1121 Proprits du tFileExist ........ 1121 Scnario : Vrifier lexistence dun fichier et le crer sil nexiste pas ....................... 1122 tFileInputARFF ........................ 1126 Proprits du tFileInputARFF ........................................ 1126 Scnario : Afficher le contenu dun fichier ARFF .............. 1127 tFileInputDelimited ................... 1130 Proprits du tFileInputDelimited ............................... 1130 Scnario 1 : Afficher le contenu dun fichier dlimit ........................................ 1132 Scnario 2 : Lire les donnes dun fichier distant en mode stream .............................. 1133 tFileInputEBCDIC .................... 1137 Proprits du tFileInputEBCDIC .......................... 1137

1038 1044 1044 1045 1048 1048 1050 1057 1057 1057 1069 1069

Composants ESB ....................... 1047

1070 1080 1080 1080 1091 1091

1091 1096 1096 1096

Guide de Rfrence des Composants Talend Open Studio

xvii

Talend Open Studio

Scnario : Extraire les donnes dun fichier EBCDIC et alimenter une base de donnes ................................. 1137 tFileInputExcel ......................... 1143 Proprits du tFileInputExcel ........................................ 1143 Scnario associ ................. 1145 tFileInputFullRow .................... 1146 Proprits du tFileInputFullRow ................................ 1146 Scnario : Lire des lignes compltes dans un fichier dlimit ............................... 1147 tFileInputJSON ........................ 1149 Proprits du tFileInputJSON ........................................ 1149 Scnario : Extraire les donnes des champs dun fichier au format JSON ................. 1150 tFileInputLDIF ......................... 1152 Proprits du tFileInputLDIF ........................................ 1152 Scnario associ ................. 1153 tFileInputMail .......................... 1154 Proprits du tFileInputMail ........................................ 1154 Scnario : Extraire des champs cls dun email ........ 1155 tFileInputMSDelimited .............. 1157 Proprits du tFileInputMSDelimited .......................... 1157 Scnario : Lecture dun fichier dlimit multi structure ........................................ 1159 tFileInputMSPositional .............. 1164 Proprits du tFileInputMSPositional .......................... 1164 Scnario associ ................. 1165 tFileInputMSXML .................... 1166 Proprits du tFileInputMSXML ...................... 1166 Scnario : Lecture dun fichier XML multi structur .... 1167 tFileInputPositional ................... 1170 Proprits du tFileInputPositional ............................... 1170 Scnario : Transformer un fichier positionnel en fichier XML ............................... 1172 tFileInputProperties .................. 1177 Proprits du tFileInputProperties .............................. 1177 Scnario : Lire et mapper la cl et les valeurs de fichiers properties et alimenter un glossaire ........................... 1178 tFileInputRegex ........................ 1181

Proprits du tFileInputRegex ........................................ Scnario : Transformer en fichier Regex en Positional ..... tFileInputXML ......................... tFileList ................................... Proprits du tFileList ......... Scnario : Itration sur un rpertoire ............................ tFileOutputARFF ..................... Proprits du tFileOutputARFF .............................. Scnario associ ................. tFileOutputDelimited ................ Proprits du tFileOutputDelimited ............................. Scnario : Ecrire des donnes dans un fichier dlimit ........ Scnario : Utiliser un flux de sortie pour sauvegarder des donnes dans un fichier local ........................................ tFileOutputEBCDIC ................. Proprits du tFileOutputEBCDIC .......................... Scnario : Crer un fichier EBCDIC partir de deux fichiers dlimits .................. tFileOutputExcel ...................... Proprits du tFileOutputExcel ................................... Scnario associ ................. tFileOutputJSON ...................... Propits du tFileOutputJSON ............................... Scnario : Ecrire un fichier JSON structur .................. tFileOutputLDIF ...................... Proprits du tFileOutputLDIF ........................... Scnario : Ecrire des donnes dans un fichier LDIF ........... tFileOutputMSDelimited ........... Proprits du tFileOutputMSDelimited .......................... Scnario associ ................. tFileOutputMSPositional ........... Proprits du tFileOutputMSPositional .......................... Scnario associ ................. tFileOutputMSXML ................. Proprits du tFileOutputMSXML ...................... Scnario associ ................. tFileOutputPositional ................ Proprits du tFileOutputPositional ............................. Scnario associ : ...............

1181 1182 1185 1186 1186 1188 1191 1191 1192 1193 1193 1195

1199 1201 1201

1201 1204 1204 1206 1207 1207 1207 1211 1211 1212 1214 1214 1215 1216 1216 1217 1218 1218 1223 1224 1224 1226

xviii

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

tFileOutputProperties ............... 1227 Proprits du tFileOutputProperties .............................. 1227 Scnario associ ................. 1228 tFileOutputXML ...................... 1229 tFileProperties .......................... 1230 Proprits du tFileProperties ........................................ 1230 Scnario : Afficher les proprits dun fichier trait ...... 1231 tFileRowCount ......................... 1233 Proprits du tFileRowCount ........................................ 1233 Scnario associ : ............... 1234 tFileTouch ............................... 1235 Proprits du tFileTouch ...... 1235 Scnario associ : ............... 1235 tFileUnarchive .......................... 1236 Proprits du tFileUnarchive ........................................ 1236 Scnario associ ................. 1237 tGPGDecrypt ........................... 1238 Proprits du tGPGDecrypt ... 1238 Scnario : Dcrypter un fichier crypt GnuPG et afficher son contenu ................ 1238 tNamedPipeClose ...................... 1241 Proprits du tNamedPipeClose ............................... 1241 Scnario associ ................. 1241 tNamedPipeOpen ...................... 1242 Proprits du tNamedPipeOpen .................................. 1242 Scnario associ ................. 1242 tNamedPipeOutput ................... 1243 Proprits du tNamedPipeOutput .......................... 1243 Scnario : Ecrire et charger des donnes via un tube nomm ................................... 1244 tPivotToColumnsDelimited ........ 1249 Proprits du tPivotToColumnsDelimited .................. 1249 Scnario : Utiliser une colonne pivot pour agrger des donnes ............................ 1249

Composants Internet ................. 1253


tFileFetch ................................ Proprits du tFileFetch ....... Scnario 1 : Rcuprer des donnes partir dun protocole HTTP ........................ Scnario 2 : Rutiliser un cookie stock pour rcuprer des fichiers via un protocole HTTP .............................. Scnario associ ................. 1254 1254

1256

1257 1259

tFileInputJSON ........................ 1260 tFTPConnection ....................... 1261 Proprits du tFTPConnection .................................. 1261 Scnarios associs .............. 1262 tFTPDelete ............................... 1263 Proprits du tFTPDelete ..... 1263 Scnarios associs .............. 1264 tFTPFileExist ........................... 1265 Proprits du tFTPFileExist .. 1265 Scnarios associs .............. 1266 tFTPFileList ............................. 1267 Proprits du tFTPFileList .... 1267 Scnario : Itration sur un rpertoire distant ................... 1268 tFTPFileProperties ................... 1271 Proprits du tFTPFileProperties .............................. 1271 Scnario associ ................. 1272 tFTPGet .................................. 1273 Proprits du tFTPGet ......... 1273 Scnario associ ................. 1274 tFTPPut .................................. 1275 Proprits du tFTPPut ......... 1275 Scnario : Copier des fichiers sur un serveur FTP distant .... 1276 tFTPRename ............................ 1279 Proprits du tFTPRename ... 1279 Scnario associ ................. 1280 tFTPTruncate .......................... 1281 Proprits du tFTPTruncate .. 1281 Scnario associ ................. 1282 tHttpRequest ............................ 1283 Proprits du tHttpRequest ... 1283 Scnario : Envoyer une requte HTTP au serveur et sauvegarder localement les rponses HTTP obtenues ...... 1284 tJMSInput ............................... 1286 Proprits du tJMSInput ....... 1286 Scnario associ : ............... 1287 tJMSOutput ............................. 1288 Proprits du tJMSOutput ..... 1288 Scnario associ : ............... 1289 tMicrosoftMQInput .................. 1290 Proprits du tMicrosoftMQInput ............................. 1290 Scnario : Ecrire et rcuprer des messages dans une file dattente de message Microsoft .................................. 1291 tMicrosoftMQOutput ................ 1294 Proprits du tMicrosoftMQOutput ........................... 1294 Scnario associ ................. 1295 tMomCommit ........................... 1296 Proprits du tMomCommit .. 1296 Scnario associ ................. 1296

Guide de Rfrence des Composants Talend Open Studio

xix

Talend Open Studio

tMomInput .............................. 1297 Proprits du tMomInput ...... 1297 Scnario : Communication asynchrone via un serveur MOM .............................. 1300 tMomMessageIdList .................. 1303 Proprits du tMomMessageIdList ............................ 1303 Scnario associ ................. 1303 tMomOutput ............................ 1304 Proprits du tMomOutput ... 1304 Scnario associ ................. 1305 tMomRollback ......................... 1306 Proprits du tMomRollback ........................................ 1306 Scnario associ ................. 1306 tPOP ....................................... 1307 Proprits du tPOP ............. 1307 Scnario : Rcuprer une slection de-mails partir dun compte de messagerie .......... 1309 tREST ..................................... 1311 Proprits du tREST ........... 1311 Scnario : Crer et rcuprer des donnes en invoquant un service Web REST ............. 1312 tRSSInput ................................ 1315 Proprits du tRSSInput ....... 1315 Scnario : Rcuprer les billets frquemment mis jour sur un blog ................. 1315 tRSSOutput ............................. 1318 Proprits du tRSSOutput ..... 1318 Scnario 1 : Crer un flux RSS et stocker les fichiers sur un serveur FTP .................. 1319 Scnario 2 : Crer un flux RSS contenant des mtadonnes ................................. 1322 Scnario 3 : Crer un fichier XML de flux ATOM ........... 1325 tSCPClose ................................ 1329 Proprits du tSCPClose ...... 1329 Scnario associ ................. 1329 tSCPConnection ....................... 1330 Proprits du tSCPConnection .................................. 1330 Scnarios associs .............. 1330 tSCPDelete ............................... 1331 Proprits du tSCPDelete ..... 1331 Scnario associ ................. 1331 tSCPFileExists .......................... 1332 Proprits du tSCPFileExists ........................................ 1332 Scnario associ ................. 1332 tSCPFileList ............................. 1333 Proprits du tSCPFileList .... 1333 Scnario associ ................. 1333

tSCPGet .................................. 1334 Proprits du tSCPGet ......... 1334 Scnario : Rcuprer des fichiers dun serveur SCP distant .................................. 1334 tSCPPut .................................. 1336 Proprits du tSCPPut ......... 1336 Scnario associ ................. 1336 tSCPRename ............................ 1337 Proprits du tSCPRename ... 1337 Scnario associ ................. 1337 tSCPTruncate .......................... 1338 Proprits du tSCPRename ... 1338 Scnario associ ................. 1338 tSendMail ................................ 1339 Proprits du tSendMail ....... 1339 Scnario : Envoyer un e-mail lors dune erreur ................. 1340 tSetKeystore ............................. 1344 Proprits du tSetKeystore .... 1344 Scnario : Extraire des informations client dun fichier WSDL priv ...................... 1345 tSocketInput ............................ 1349 Proprits du tSocketInput .... 1349 Scnario : Transfrer des donnes vers un port dcoute ........................................ 1350 tSocketOutput .......................... 1353 Proprits du tSocketOutput ........................................ 1353 Scnario associ ................. 1354 tSOAP ..................................... 1355 Proprits du tSOAP ........... 1355 Scnario : Extraire des informations mto en utilisant un Service Web ...................... 1356 tWebServiceInput ..................... 1359 Proprits du tWebServiceInput .................................. 1359 Scnario 1 : Extraire des images laide dun Webservice ................................. 1361 Scnario 2 : Lire des donnes publies dans un service Web, en utilisant les fonctions avances du tWebServiceInput ............................. 1362 tXMLRPCInput ....................... 1367 Proprits du tXMLRPCInput ........................................ 1367 Scnario : Chercher le nom dun Etat via une mthode XMLRPC ......................... 1368

Composants Logs & Errors ...... 1371


tAssert ..................................... 1372 Proprits du tAssert ........... 1372

xx

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Scnario : Paramtrer une condition assertive pour lexcution dun Job ............ tAssertCatcher ......................... Proprits du tAssertCatcher ........................................ Scnario associ ................. tChronometerStart ................... Proprits du tChronometerStart .................................. Scnario associ ................. tChronometerStop .................... Proprits du tChronometerStop .................................. Scnario : Mesurer la dure de traitement dun sous-Job ou dune partie dun sous-Job ........................................ tDie ......................................... Proprits du tDie ............... Scnarios associs .............. tFlowMeter .............................. Proprits du tFlowMeter ..... Scnario associ ................. tFlowMeterCatcher ................... Proprits du tFlowMeterCatcher ................................. Scnario : Mesurer le flux dun Job ........................... tLogCatcher ............................. Proprits du tLogCatcher .... Scnario 1 : Avertissement & log lors de la cration dentres ........................... Scnario 2 : Monitorer & arrter un Job ....................... tLogRow .................................. Proprits du tLogRow ........ Scnarios associs .............. tStatCatcher ............................. Proprits du tStatCatcher .... Scnario : Afficher les statistiques du Job ..................... tWarn ..................................... Proprits du tWarn ............ Scnarios associs .............. tAddLocationFromIP ................ Proprits du tAddLocationFromIP ............................. Scnario : Identifier la localisation gographique dune adresse IP ......................... tBufferInput ............................. Proprits du tBufferInput .... Scnario : Rcuprer les donnes mises en tampon ..........

1372 1378 1378 1379 1380 1380 1380 1381 1381

1381 1385 1385 1385 1386 1386 1386 1387 1387 1388 1392 1392

1392 1394 1396 1396 1396 1397 1397 1397 1400 1400 1400 1402 1402

tBufferOutput .......................... 1408 Proprits du tBufferOutput .. 1408 Scnario 1 : Mettre des donnes en tampon .................. 1408 Scnario 2 : Mettre les donnes de sortie en mmoire tampon du serveur dapplication Web .............. 1410 Scnario 3 : Appeler un Job contenant des variables de contexte partir de votre navigateur Web ..................... 1413 Scnario 4 : Appeler un Job export en tant que service Web dans un autre Job ......... 1415 tContextDump .......................... 1418 Proprits du tContextDump ........................................ 1418 Scnario associ ................. 1418 tContextLoad ........................... 1419 Proprits du tContextLoad ... 1419 Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL ..................... 1420 tFixedFlowInput ....................... 1423 Proprits du tFixedFlowInput .................................. 1423 Scnarios associs .............. 1423 tMemorizeRows ........................ 1425 Proprits du tMemorizeRows ............................... 1425 Scnario : Compter le nombre doccurrences de diffrents ges ................................. 1426 tMsgBox .................................. 1431 Proprits du tMsgBox ........ 1431 Scnario : Test de type Hello world! ............................. 1431 tRowGenerator ......................... 1433 Proprits du tRowGenerator ........................................ 1433 Scnario : Gnration alatoire de fichiers de test ......... 1434

Composants Orchestration ....... 1437


tFileList ................................... tFlowToIterate ......................... Proprits du tFlowToIterate ........................................ Scnario : Transformer un flux de donnes en liste ........ tForeach .................................. Proprits du tForeach ......... Scnario : Faire une boucle sur une liste et rcuprer les valeurs ............................. tInfiniteLoop ............................ 1438 1439 1439 1439 1443 1443

Composants Misc ....................... 1401

1403 1405 1405 1405

1443 1446

Guide de Rfrence des Composants Talend Open Studio

xxi

Talend Open Studio

Proprits du tInfiniteLoop ... 1446 Scnario associ ................. 1446 tIterateToFlow ......................... 1447 Proprits du tIterateToFlow ........................................ 1447 Scnario : Transformer une liste de fichiers en flux de donnes ............................ 1448 tLoop ...................................... 1450 Proprits du tLoop ............ 1450 Scnario : Excuter un Job partir dune boucle .............. 1451 tPostjob ................................... 1453 Proprits du tPostjob .......... 1453 Scnario associ ................. 1453 tPrejob .................................... 1454 Proprits du tPrejob ........... 1454 Scnario associ ................. 1454 tReplicate ................................ 1455 Proprits du tReplicate ....... 1455 Scnario associ ................. 1455 tRunJob .................................. 1456 tUnite ...................................... 1457 Proprits du tUnite ............ 1457 Scnario : Itration sur des fichiers et fusion de contenu .... 1458 tSleep ...................................... 1461 Proprits du tSleep ............ 1461 Scnario associ ................. 1461 tWaitForFile ............................ 1462 Proprits du tWaitForFile .... 1462 Scnario : Attendre la suppression dun fichier ........... 1464 tWaitForSocket ........................ 1466 Proprits du tWaitForSocket ........................................ 1466 Scnario associ ................. 1467 tWaitForSqlData ...................... 1468 Proprit du tWaitForSqlData ........................................ 1468 Scnario : Attendre lajout de lignes dans une table ........... 1469

Composants Processing ............. 1473


tAggregateRow ......................... 1474 Proprits du tAggregateRow ........................................ 1474 Scnario : Agrger des valeurs et trier des donnes ...... 1476 tAggregateSortedRow ............... 1479 Proprits du tAggregateSortedRow ............................ 1479 Scnario associ ................. 1480 tConvertType ........................... 1481 Proprits du tConvertType .. 1481 Scnario : Convertir des types de donnes Java ................. 1482 tDenormalize ............................ 1486

Proprits du tDenormalize ... 1486 Scnario 1 : Dnormaliser une colonne ....................... 1486 Scnario 2 : Dnormaliser plusieurs colonnes .............. 1488 tDenormalizeSortedRow ............ 1491 Proprits du tDenormalizeSortedRow ..................... 1491 Scnario : Regrouper des lignes tries ....................... 1491 tExternalSortRow ..................... 1495 Proprits du tExternalSortRow ................................ 1495 Scnario associ ................. 1496 tExtractDelimitedFields ............. 1497 Proprits du tExtractDelimitedFields ........................... 1497 Scnario : Extraire des champs partir dun fichier dlimit par des virgules ...... 1498 tExtractPositionalFields ............. 1501 Proprits du tExtractPositionalFields ........................... 1501 Scnario associ ................. 1502 tExtractRegexFields .................. 1503 Proprits du tExtractRegexFields ............................... 1503 Scnario : Extraire des noms, des domaines et domaines de premier niveau partir dadresses e-mail ................ 1504 tExtractXMLField .................... 1507 tFilterColumns ......................... 1508 Proprits du tFilterColumns ........................................ 1508 Scnario associ ................. 1508 tFilterRow ............................... 1509 Proprits du tFilterRow ...... 1509 Scnario : Filtrer une liste de noms et faire une recherche dans la liste ....................... 1510 tJoin ....................................... 1513 Proprits du tJoin .............. 1513 Scnario : Faire une correspondance exacte entre deux colonnes et crire les donnes rejetes ............................. 1513 tMap ....................................... 1518 Proprits du tMap ............. 1518 Scnario 1 : Mapping simple de donnes avec filtre et jointure explicite ..................... 1518 Scnario 2 : Mapping de donnes avec rejet Inner join ...... 1522 Scnario 3 : Mapping de jointure en cascade .................. 1526

xxii

Guide de Rfrence des Composants Talend Open Studio

Talend Open Studio

Scnario 4 : Mapping avanc avec filtres, jointures explicites et rejet Inner join ......... 1527 Scnario 5 : Mapping avanc avec filtres et diffrents rejets ........................................ 1531 Scnario 6 : Mapping avanc avec rechargement de la base de rfrence chaque ligne ... 1534 Scnario 7 : Mapping avec des tables de sortie .............. 1540 tNormalize ............................... 1545 Proprits du tNormalize ...... 1545 Scnario : Normaliser des donnes ............................ 1545 tReplace .................................. 1548 Proprits du tReplace ......... 1548 Scnario : Remplacement mutliple et filtrage de colonnes .............................. 1549 tSampleRow ............................. 1552 Proprits du tSampleRow .... 1552 Scnario : Filtrer des lignes et des groupes de lignes .......... 1552 tSortRow ................................. 1555 Proprits du tSortRow ........ 1555 Scnario : Trier des donnes ........................................ 1556 tSplitRow ................................. 1558 Proprits du tSplitRow ....... 1558 Scnario 1 : Sparer une ligne en plusieurs lignes .............. 1558 tWriteJsonField ........................ 1562 Proprits du tWriteJsonField ........................................ 1562 Scnario associ ................. 1562 tXMLMap ............................... 1564 Proprits du tXMLMap ...... 1564 Scnario 1 : Mapper et transformer des donnes de source XML ............................... 1565 Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML .............. 1570 Scnario 3 : Mapper des donnes laide dun filtre ........ 1574 Scnario 4 : Capturer les donnes rejetes par le flux Lookup et le filtre .................... 1577 Scnario 5 : Mapper des donnes laide dun lment group ............................ 1580 Classer les donnes de sortie avec l'lment "aggregate" .... 1584

Proprits du tRunJob ......... Scnario : Excuter un Job fils .................................. tSetEnv ................................... Proprits du tSetEnv .......... Scnario : Modifier une variable lors de lexcution dun Job .................................. tSSH ....................................... Proprits du tSSH ............. Scnario : Accder aux informations du systme distant via SSH ............................ tSystem ................................... Proprits du tSystem .......... Scnario : Echo Hello World! ............................

1588 1590 1594 1594

1594 1597 1597

1599 1601 1601 1603

Composants Talend MDM ........ 1605


tMDMBulkLoad ....................... 1606 Proprits du tMDMBulkLoad ................................ 1606 Scnario : Charger des enregistrements dans une entit mtier .............................. 1609 tMDMClose ............................. 1614 Proprits du tMDMClose .... 1614 Scnario associ ................. 1614 tMDMConnection ..................... 1615 Proprits du tMDMConnection .................................. 1615 Scnario associ ................. 1615 tMDMDelete ............................ 1616 Proprits du tMDMDelete ... 1616 Scnario : Supprimer des donnes matre d'un hub MDM .............................. 1617 tMDMInput ............................. 1623 Proprits du tMDMInput ..... 1623 Scnario : Lire les donnes matre dun hub MDM ......... 1624 tMDMOutput ........................... 1628 Proprits du tMDMOutput .. 1628 Scnario : Ecrire des donnes matre dans un hub MDM ..... 1631 tMDMReceive .......................... 1637 Proprits du tMDMReceive ........................................ 1637 Scnario associ ................. 1638 tMDMRouteRecord .................. 1639 Proprits du tMDMRouteRecord ............................. 1639 Scnario : Router un enregistrement vers lEvent Manager ........................................ 1640 tMDMSP ................................. 1649 Proprits du tMDMSP ........ 1649

Composants System ................... 1587


tRunJob .................................. 1588

Guide de Rfrence des Composants Talend Open Studio

xxiii

Talend Open Studio

Scnario : Excuter une procdure stocke dans le hub MDM .............................. tMDMTriggerInput .................. Proprits du tMDMTriggerInput ............................ Scnario associ ................. tMDMTriggerOutput ................ Proprits du tMDMTriggerOutput ............................ Scnario associ ................. tMDMViewSearch .................... Proprits du tMDMViewSearch ....................... Scnario : Rcuprer des enregistrements dun hub MDM hub via une vue existante ..... tHashInput .............................. Proprits du tHashInput ...... Scnario : Lire des donnes directement dans la mmoire cache afin d'y accder rapidement ................................ tHashOutput ............................ Proprits du tHashOutput .... Scnario associ .................

1650 1655 1655 1656 1657 1657 1658 1659 1659

1661 1666 1666

Composants Technical ............... 1665

1666 1671 1671 1672

Composants XML ...................... 1673


tAdvancedFileOutputXML ........ 1674 Proprits du tAdvancedFileOutputXML .................... 1674 Scnario : Crer un fichier XML laide dune boucle ... 1681 tDTDValidator ......................... 1685 Proprits du tDTDValidator ........................................ 1685 Scnario : Valider un fichier XML ............................... 1685 tEDIFACTtoXML .................... 1688 Proprits du tEDIFACTtoXML ............................. 1688 Scnario : Passer dEDIFACT XML ............ 1688 tExtractXMLField .................... 1691 Proprits du tExtractXMLField ................................ 1691 Scnario 1 : Extraire les donnes XML dun champ dune table de base de donnes ...... 1692 Scnario 2 : Extraire les donnes valides et les donnes errones partir dun champ XML dans fichier dlimit .... 1694 tFileInputXML ......................... 1698 Proprits du tFileInputXML ........................................ 1698

Scnario 1 : Extraire des adresses XML ................... 1700 Scnario 2 : Extraire les donnes XML errones dans un flux de rejet ...................... 1701 tFileOutputXML ...................... 1705 Proprits de tFileOutputXML ........................... 1705 Scnario associ ................. 1707 tWriteXMLField ....................... 1708 Proprits du tWriteXMLField ................................ 1708 Scnario : Extraire la structure dun fichier XML et linsrer dans les champs dune base de donnes ......... 1709 tXMLMap ............................... 1713 tXSDValidator ......................... 1714 Proprits du tXSDValidator ........................................ 1714 Scnario : Valider des flux de donnes par rapport un fichier XSD ........................ 1714 tXSLT ..................................... 1718 Proprits du tXSLT ........... 1718 Scnario : Transformer un fichier XML en HTML laide dune feuille de style XSL .... 1718

xxiv

Guide de Rfrence des Composants Talend Open Studio

Prface
Informations gnrales
Objectif
Ce Guide de rfrence dtaille les principaux composants accessibles partir de chacun des diffrents groupes de la Palette de Talend Open Studio. Le Guide de rfrence des composants de Talend Open Studio est la version franaise non exhaustive du Components Reference Guide anglais. Pour les composants non documents, rfrez-vous ce dernier. Veillez consulter rgulirement le site Internet de Talend pour tlcharger la dernire version du Guide de rfrence franais. Les informations contenues dans ce document sappliquent aux versions 5.0.x de Talend Open Studio.

Public vis
Ce guide sadresse aux utilisateurs et aux administrateurs de Talend Open Studio. Dans ce document, linterface prsente par le biais des captures dcran peut tre lgrement diffrente de la vtre.

Conventions typographiques
Ce guide utilise les conventions typographiques suivantes : texte en gras : boutons et champs dune fentre ou dune bote de dialogue, touches du clavier, menus et options des menus ; texte en [gras]: titre des fentres, assistants et botes de dialogue ; texte en courier : paramtres systme renseigns par lutilisateur ; texte en italique : nom des fichiers, schmas, colonnes, lignes ou variables dont il est question dans les exemples utiliss, ainsi que le nom des champs des vues Basic settings et Advanced settings dont il est fait mention dans le tableau des proprits de chaque composant. Licne introduit un paragraphe apportant une information supplmentaire sur un point important. Elle introduit galement les commentaires relatifs un tableau ou une image. Licne introduit un message apportant une information relative aux modalits dexcution, ou des recommandations particulires. Elle est galement utilise pour attirer lattention de lutilisateur sur certaines informations ou situations particulirement importantes.

Guide de Rfrence des Composants Talend Open Studio

Historique des versions

Historique des versions


Le tableau ci-dessous liste les modifications apportes au Guide de Rfrence de Talend Open Studio. Version v4.2_a Date 28/04/2011 Historique Les mises jour du Guide de Rfrence Talend Open Studio comprennent : - Ajout de la famille de composants ESB. - Ajout de composants dans Data Quality, Processing, XML et MDM, comme tStandardizeRow, les composants EDIFACT... - Ajout des informations relatives aux schmas dynamiques dans les chapitres correspondants. - Modifications dans les paramtres et les scnarios de nombreux composants afin de correspondre aux changements de linterface. v4.2_b 11/07/2011 Les mises jour du Guide de Rfrence Talend Open Studio comprennent : - Ajout de composants dans Databases, Data Quality, et ELT. - Ajout dun scnario pour le composant tMysqlInput. v5.0a 21/11/2011 Les mises jour du Guide de Rfrence Talend Open Studio comprennent : - Restructuration post-migration. - Mise jour de la documentation pour reflter le nouveau nom des produits. Pour plus dinformations, consultez le site web de Talend. - Ajout des familles Cloud, DotNET et Technical. - Nouveaux composants dans les familles Business Intelligence, Cloud, Data Quality, DotNET, ESB Processing, Technical, notamment : tHashInput, tHashOutput, tJasperOutput, tSplitRow, tRESTRequest... - Modifications dans les paramtres et les scnarios de nombreux composants afin de reflter les changements de l'interface.

Remarques et Support
Votre opinion nous intresse, nhsitez pas nous faire part de vos remarques, suggestions, requtes concernant la documentation ou le produit, et obtenez le support de notre quipe Talend, sur le Forum Talend (en anglais) disponible ladresse : http://talendforge.org/forum

xxvi

Guide de Rfrence des Composants Talend Open Studio

Composants Business
Ce chapitre passe en revue les principaux composants prsents dans le groupe Business de la Palette de Talend Open Studio. La famille Business regroupe les connecteurs couvrant des besoins spcifiques, tels que la lecture et lcriture de base de donnes de type CRM ou ERP et la lecture et lcriture de systme SAP.

Guide de Rfrence des Composants Talend Open Studio

tAlfrescoOutput

tAlfrescoOutput

Proprits du tAlfrescoOutput
Famille du composant Fonction Objectif Basic settings Business Le composant tAlfrescoOutput permet de crer des documents dmatrialiss sur un serveur Alfresco o ils sont indexs selon des modles significatifs. Ce composant permet de crer et de grer des documents sur un serveur Alfresco. URL Login et Password Base Saisissez lURL pour vous connecter lapplication Web Alfresco. Entrez les donnes didentification de lutilisateur au serveur Alfresco. Saisissez le chemin daccs de lemplacement o stocker le document, ou Cochez la case Map... puis choisissez, partir de la liste droulante Column, lemplacement darrive. Lorsque vous entrez le nom de lemplacement, assurez-vous de le protger par des doubles barres obliques inverses (\\). Document Mode Slectionnez, partir de la liste droulante, le mode que vous voulez utiliser pour crer votre document. Create only : permet de crer un document sil nexiste pas pralablement. Notez cependant quun message derreur apparatra si vous essayez de crer un document qui existe dj. Create or update : permet de crer un document qui nexiste pas encore ou de mettre jour un document existant. Container Mode Slectionnez, partir de la liste droulante, le mode que vous voulez utiliser pour le dossier de destination sur le serveur Alfresco. Update only : permet de mettre jour un dossier de destination dj existant. Notez cependant quun message derreur apparatra si vous essayez de mettre jour un document qui nexiste pas. Create or update : permet de crer un dossier de destination sil nexiste pas au pralable, ou de mettre jour un dossier existant. Define Document Type Cliquez sur les trois points [...] pour afficher lditeur tAlfrescoOutput. Cet diteur vous permet :

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAlfrescoOutput

- de slectionner le fichier dans lequel vous avez dfini les mtadonnes pour servir de cadre lors de lenregistrement du document sur Alfresco - de dfinir le type du document - de slectionner, partir de la liste droulante available aspects, lun des aspects du modle, puis de cliquer sur le bouton [+] pour ajouter cet aspect la liste de gauche. Property Mapping Affiche les paramtres renseigns dans lditeur tAlfrescoOutput, selon lesquels le document sera cr sur le serveur Alfresco. Notez que vous pouvez modifier nimporte lequel des schmas dentre de la zone Property Mapping. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour effectuer des changements sur le schma. Notez que le schma devient automatiquement local (Built-in) lorsque vous effectuez des changements. Result Log File Name Advanced settings Permet de parcourir le fichier dans lequel vous voulez enregistrer les logs lis lexcution du Job.

Configure Target Loca- Permet de configurer le type par dfaut des conteneurs. tion Container Cochez cette case pour afficher de nouveaux champs dans lesquels vous pouvez modifier le type du conteneur et utiliser les types que vous avez crs sur le modle pre/fils. Configure Permissions Lorsque cette case est coche, loption permet de configurer manuellement les droits daccs aux conteneurs et aux documents. Cochez la case Inherit Permissions pour synchroniser les droits daccs entre les conteneurs et les documents. Cliquez sur le bouton [+] pour ajouter de nouvelles lignes la liste Permissions ; vous pourrez alors assigner des rles un utilisateur ou groupe dutilisateurs dans les colonnes User or group et User or group column. Encoding Slectionnez le type dencodage partir de la liste ou choisissez loption Custom pour le dfinir manuellement. Ce champ doit obligatoirement tre renseign. Target Permet de crer de nouveaux documents sur Alfresco qui contiennent des liens associs des documents dj existants sur ce serveur, pour faciliter le processus de navigation par exemple. Pour crer des associations : -Ouvrez lditeur tAlfresco.

Association Mapping

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAlfrescoOutput

-Cliquez sur le bouton Add puis slectionnez un modle pour lequel vous avez dj dfini des aspects contenant des associations. -Cliquez sur la liste droulante, en haut de la fentre de lditeur, et slectionnez le type de document correspondant. -Cliquez sur OK pour fermer lditeur et afficher lassociation ainsi cre dans la liste Association Target Mapping. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis en tant que composant de sortie et requiert un composant de dbut.

Limitation/Conditions pra- Pour pouvoir utiliser le composant tAlfrescoOutput, il est ncessaire dinstaller lables certaines ressources utiles. Pour plus dinformations, consultez la section intitule Procdure dinstallation .

Procdure dinstallation
Pour pouvoir utiliser le composant tAlfrescoOutput dans Talend Open Studio, vous devez tout dabord installer le serveur Alfresco ainsi que quelques ressources utiles. Les sous-sections ci-aprs indiquent en dtail les conditions pralables ncessaires, ainsi que la procdure dinstallation.

Conditions pralables
Commencez par excuter les oprations suivantes : Tlchargez le fichier alfresco-community-tomcat-2.1.0.zip Dzippez-le dans un dossier dinstallation, par exemple : C:\Program Files\Java\jdk1.50_16 Installez JDK 1.5.0+ Effectuez une mise jour de la variable JAVA_HOME (JAVA_HOME= C:\alfresco) A partir du dossier dinstallation (C:\alfresco), lancez le serveur Alfresco en utilisant le script alf_start.bat Assurez-vous que le serveur Alfresco est bien lanc avant dutiliser le composant tAlfrescoOutput.

Installation du module Talend Alfresco


Notez que le fichier talendalfresco_20081014.zip est propos avec le composant tAlfrescoOutput dans Talend Open Studio. Pour installer le module Talend Alfresco :

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAlfrescoOutput

A partir du fichier talendalfresco_20081014.zip, dans le dossier talendalfresco_20081014\alfresco, recherchez les fichiers JAR suivants : staxapi-1.0.1.jar, wstx-lgpl-3.2.7.jar, talendalfresco-client_1.0.jar et talendalfresco-alfresco_1.0.jar, puis dplacez-les vers C:\alfresco\tomcat\webapps\alfresco\WEB-INF\lib Ajoutez le filtre didentification des commandes au fichier web.xml situ au chemin daccs C: \alfresco\tomcat\webapps\alfresco\WEB-INF son WEB-INF/, daprs le modle de lexemple situ dans le dossier talendalfresco_20081014/alfresco du fichier zipp talendalfresco_20081014.zip Les captures dcran ci-dessous montrent la partie ajouter (lignes en bleu) au fichier web.xml alfresco.

Informations utiles pour une utilisation avance du composant


Installer de nouveaux types pour Alfresco : A partir du fichier package_jeu_test.zip , dans le dossier package_jeu_test/ fichiers_conf_alfresco2.1, recherchez les fichiers suivants : xml H76ModelCustom.xml (description du modle), web-client-config-custom.xml (interface Web du modle) et custom-model-context.xml (enregistrement du nouveau modle), puis collez-les dans le dossier suivant : C:/alfresco/tomcat/shared/classes/alfresco/extension Dates : Les dates doivent correspondre au type Talend, java.util.Date Les colonnes qui ne comportent ni mapping, ni valeur par dfaut (celles du type Date par exemple) se voient attribuer une chane de caractres vide. Solution : effacez toutes les colonnes sans mapping ni valeur par dfaut. Notez cependant quune modification de type Alfresco les rtablira. Contenu :

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAlfrescoOutput

Ne confondez pas le chemin daccs au fichier dont vous voulez crer le contenu et celui de son emplacement cible sur Alfresco. Noubliez pas lURL ! Elle permet de cibler de nombreux protocoles, dont le transfert de fichiers et le HTTP. Prcdez les URLs renvoyant des fichiers du systme de fichiers en rseau de "file:", si vous utilisez Windows en local, ou de "file://", si vous utilisez soit Windows sur un rseau (qui accepte galement la mention "file: \ \"), soit Linux. Nutilisez jamais la double barre oblique inverse (\\) dans le chemin daccs cible (chappement automatique), moins que vous nentriez le chemin directement dans les proprits de base (Basic settings) du composant tAlfrescoOutput ou que vous neffectuiez une concatnation, dans lditeur tMap par exemple. Proprits multiples ou associations : Il est possible de nen crer quune seule par document en y mappant une valeur String, ou une ou plusieurs en y mappant une valeur List(objet). Il est possible de vider une proprit multiple en lui mappant une liste vide que vous pouvez crer, par exemple, en utilisant la commande new java.util.ArrayList()dans le composant tMap. En revanche, il est impossible de supprimer une association. Faire des List(object)avec le composant tAggregate : -dfinissez dans un fichier une table de relation n-n, contenant par exemple une ligne name (pouvant tre retrouve dans les input rows) et une ligne category (pouvant tre dfinie avec son mapping dans un fichier tiers). -group by : input name, output name. -opration: output categoryList, fonction list(object), input category. ATTENTION il sagit dune list (object) et non dune simple list ! Rfrences (documents et dossiers) : Les rfrences sont cres par mapping dune ou plusieurs rfrences de nud existantes (xpath ou namepath), en type String ou List(object). Une erreur dans lassociation ou la proprit de type rfrence nempche pas la cration du nud qui la porte. Les proprits de type rfrence sont cres dans longlet des proprits standards (Basic Settings). Les associations sont cres dans longlet des proprits avances (Advanced Settings).

Dmatrialisation, tAlfrescoOutput et Gestion de Contenu


La dmatrialisation est le processus qui sert convertir les documents concrets au format numrique, permettant ainsi de passer dune utilisation de documentation physique des systmes de Gestion de Contenu lectroniques. Un systme de Gestion de Contenu permet de grer un large ventail de documents, allant des plus basiques aux certificats dactions par exemple. Les entreprises procdent la dmatrialisation de leur contenu par traitement des documents, qui peut tre ralis soit la main, soit de manire automatique grce une machine Compte tenu de la diversit des contenus dmatrialiser, les entreprises sont obliges dutiliser des technologies diverses. Scanner les documents papier, crer des interfaces pour capter les documents lectroniques dautres applications, convertir les documents images en documents textes lisibles et modifiables par une machine... Ceci nest quun exemple des technologies employes.

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer des documents sur un serveur Alfresco

De plus, les documents scanns ainsi que les fax numriques ne peuvent tre lus par des machines. Diffrentes technologies de reconnaissance des caractres sont utilises pour les convertir en donnes utilisables. La Reconnaissance de Caractres Manuscrits (RCM) et la Reconnaissance Optique de Marques (ROM) en sont deux exemples. Les mtadonnes de support, qui permettent didentifier le contenu de manire efficace grce des requtes spcifiques, sont au moins aussi importantes que le contenu capt lors de la dmatrialisation, en diffrents formats et partir de nombreuses sources. Ds lors, comment agrger et indexer dans un systme de Gestion de Contenu le contenu dun document en mme temps que ses mtadonnes associes, pour quil puisse tre extrait et trait de manire significative ? Talend vous apporte la rponse par le biais de son composant tAlfrescoOutput. Le composant tAlfrescoOutput vous permet de stocker et de grer vos documents lectroniques, ainsi que les mtadonnes qui y sont associes, sur le serveur Alfresco, systme leader sur le march de la Gestion de Contenu. La figure ci-dessous illustre le rle de Talend la fois dans le processus de dmatrialisation et dans le systme Gestion de Contenu (Alfresco).

Scnario : Crer des documents sur un serveur Alfresco


Ce scnario Java dcrit un Job deux composants permettant de crer deux fichiers de documents et leurs mtadonnes associes sur un serveur Alfresco, le systme de Gestion de Contenu en Java. A partir de la Palette, cliquez-dposez les composants tFileInputDelimited et tAlfrescoOutput sur lditeur graphique. Reliez ces deux composant laide dun lien Row Main.

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer des documents sur un serveur Alfresco

Dans lditeur graphique, double-cliquez sur le tFileInputDelimited pour en afficher les paramtres de base (Basic settings). Renseignez le chemin daccs au fichier dans le champ File Name ainsi que toutes les autres proprits. Notez cependant que si vous avez dj stock vos schmas dentre en local dans le Repository, vous pouvez tout simplement rcuprer le fichier choisi partir du nud Metadata et le dposer sur lditeur graphique. Les paramtres du fichier dlimit safficheront alors automatiquement dans les champs concerns de longlet Basic settings du composant concern. Pour plus dinformations sur les mtadonnes, consultez le Guide Utilisateur de Talend Open Studio.

Dans ce scnario, le fichier dlimit prsente les mtadonnes et le chemin daccs de deux documents que vous allez crer sur le serveur Alfresco. Le schma dentre des documents de dcompose en quatre colonnes : file_name, destination_folder name, source_path, et author.

Le schma dentre du fichier dlimit sera donc comme suit :

Dans lditeur graphique, double-cliquez sur le composant tAlfrescoOutput pour en afficher les paramtres de base (Basic settings).

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer des documents sur un serveur Alfresco

Dans la partie Alfresco Server, saisissez lURL du serveur Alfresco ainsi que les donnes didentification de lutilisateur dans les champs correspondants. Dans la partie TargetLocation, vous pouvez soit saisir le nom de lemplacement du serveur o vous voulez stocker le document, soit cocher la case Map... puis choisir lemplacement cible partir de la liste droulante Column, soit destination_folder_name dans ce scnario. Lorsque vous renseignez le nom de lemplacement, assurez vous de bien utiliser le caractre dchappement double barre oblique inverse (\\). Dans la liste droulante Document Mode, slectionnez le mode que vous voulez utiliser pour la cration de vos documents. Dans la liste droulante Container Mode, slectionnez le mode que vous voulez utiliser pour le dossier de destination sur Alfresco. Cliquez sur le bouton [...] de loption Define Document Type pour ouvrir lditeur tAlfrescoOutput.

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer des documents sur un serveur Alfresco

Cliquez sur le bouton Add pour parcourir et slectionner le fichier xml qui comprend les mtadonnes selon lesquelles vous voulez sauvegarder les documents sur Alfresco. Tous les aspects disponibles du modle slectionn saffichent dans la liste Available Aspects. Vous pouvez parcourir le dossier modle en local ou en rseau. Une fois dfinis les aspects appliquer au document que vous allez crer sur Alfresco, vous naurez plus besoin de ce dossier. Si ncessaire, slectionnez le ou les aspect(s) ajouter aux mtadonnes crire sur le serveur Alfresco, partir de la liste droulante Available Aspects. Dans ce scnario, lobjectif est de faire en sorte que le nom de lauteur fasse partie des mtadonnes enregistres sur Alfresco. Cliquez sur la liste droulante, situe en haut de la fentre de lditeur, pour slectionner le type donner aux documents crs sur Alfresco. Dans cet exemple, il sagit de Content. Tous les aspects dfinis, utiliss pour slectionner les mtadonnes crire sur Alfresco, saffichent dans la liste Property Mapping de longlet Basic Settings du composant tAlfrescoOutput. Dans ce scnario, il sagit de trois aspects, deux aspects de base pour le type Content (content et name) ainsi quun aspect additionnel (author). Cliquez sur Sync columns pour propager automatiquement toutes les colonnes du fichier dlimit. Si ncessaire, cliquez sur Edit schema pour avoir un aperu de la structure des donnes du tAlfrescoOutput en sortie.

10

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer des documents sur un serveur Alfresco

Cliquez sur le bouton [...] situ ct du champ Result Log File Name puis parcourez le fichier o vous voulez sauvegarder les logs aprs excution du Job. Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Les deux documents sont crs sur Alfresco grce aux mtadonnes des schmas dentre.

Guide de Rfrence des Composants Talend Open Studio

11

tBonitaDeploy

tBonitaDeploy

Proprits du tBonitaDeploy
Famille de composant Fonction Business/Bonita Le tBonitaDeploy configure un moteur Bonita Runtime et dploie un processus spcifique Bonita (un fichier .bar export de la solution Bonita solution) vers ce moteur. Ce composant dploie un processus spcifique Bonita vers Bonita Runtime. Bonita version Slectionnez un numro de version pour le moteur Bonita Runtime.

Objectif Basic settings

Bonita Runtime Envi- Parcourez votre rpertoire, ou saisissez le chemin ronment File daccs au fichier denvironnement Bonita Runtime. Bonita Runtime Jass Parcourez votre rpertoire, ou saisissez le chemin File daccs au fichier jass Bonita Runtime. Bonita Runtime logging Parcourez votre rpertoire, ou saisissez le chemin file daccs au fichier de log Bonita Runtime. Login Module Business Archive Saisissez le nom du module de login au moteur Bonita Runtime dfini dans le fichier Bonita Runtime jaas. Parcourez votre rpertoire, ou saisissez le chemin daccs au fichier .bar Bonita de traitement que vous souhaitez utiliser. Saisissez votre identifiant de connexion Bonita. Saisissez votre mot de passe de connexion Bonita. Cette case nest pas coche par dfaut, pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Cochez cette case pour collecter les mtadonnes de traitement du Job au niveau du Job ainsi quau niveau de chaque composant. Liens de sortie (dun composant un autre) : Trigger : Run if, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError. Liens dentre (dun composant un autre) : Trigger : Run if, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

User name Password Die on error

Advanced settings

tStatCatcher Statistics

Utilisation Connections

Ce composant est gnralement utilis en standalone.

12

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Global Variables

Process Definition UUID : Indique le numro dID du processus dploy. Disponible en tant que variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio.

Limitation

Le fichier denvironnement Bonita Runtime, le fichier jaas Bonita Runtime et le fichier de log Bonita Runtime doivent tre stocks sur le serveur dexcution du Job, laide de ce composant.

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

13

tBonitaInstantiateProcess

tBonitaInstantiateProcess

tBonitaInstantiateProcess Properties
Famille de composant Fonction Objectif Basic settings Business/Bonita Le composant tBonitaInstantiateProcess instancie un processus existant dans un moteur Bonita Runtime puis lance lexcution. Ce composant commence linstance dun processus spcifique dploy dans le moteur Bonita Runtime. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Bonita Runtime Envi- Parcourez votre rpertoire, ou saisissez le chemin ronment File daccs au fichier denvironnement Bonita Runtime. Bonita Runtime Jass Parcourez votre rpertoire, ou saisissez le chemin File daccs au fichier jass Bonita Runtime. Bonita Runtime logging Parcourez votre rpertoire, ou saisissez le chemin file daccs au fichier de log Bonita Runtime. Use Process ID Cette case nest pas coche par dfaut, pour activer les champs process name (nom du processus)et process version (version du processus), afin que vous puissiez saisir les informations correspondantes du processus spcifique que vous souhaitez instancier. Ces informations seront utilises pour gnrer automatiquement lID du processus. Une fois la case coche, le champ Process definition ID est activ, et vous pouvez saisir lID requis du processus. LID du processus est cr lorsque ce processus est dploy dans le moteur Bonita Runtime. User name Password Die on error Saisissez lidentifiant utilis pour instancier ce processus.. Saisissez le mot de passe utilis pour instancier ce processus. Cette case nest pas coche par dfaut, pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur.

14

Guide de Rfrence des Composants Talend Open Studio

Scnario : Excuter un processus Bonita via un Job Talend

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les mtadonnes de traitement du Job au niveau du Job ainsi quau niveau de chaque composant.

Utilisation Connections

Ce composant est gnralement utilis en standalone ou en tant que composant de sortie. Liens de sortie (dun composant un autre) : Trigger : Run if, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError. Liens dentre (dun composant un autre) : Row : Main. Trigger : Run if, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio.

Global Variables

Process Definition UUID : Indique le numro dID du processus dploy. Disponible en tant que variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Limitation

n/a

Scnario : Excuter un processus Bonita via un Job Talend


Ce scnario dcrit un Job dployant un processus Bonita dans le moteur Bonita Runtime et excutant ce processus, dans lequel une requte sur le personnel est traite. Ce Job utilise trois composants.

Un tBonitaDeploy : ce composant dploie un processus Bonita dans le moteur Bonita Runtime.

Guide de Rfrence des Composants Talend Open Studio

15

Scnario : Excuter un processus Bonita via un Job Talend

Un tFixedFlowInput : ce composant gnre le schma utilis comme paramtre dexcution du processus dploy. Un tBonitaInstantiateProcess : ce composant excute le processus dploy. Lorsque vous gnrez un schma laide dun tFixedFlowInput, les noms de colonnes du schma doivent tre identiques ceux des paramtres Bonita utiliss pour excuter le mme processus dans Bonita. Avant de commencer reproduire ce schma, prparez votre fichier Bonita .bar, cest--dire le processus export du systme Bonita et qui sera dploy dans le moteur Bonita Runtime. Dans ce scnario, ce fichier est TEST--4.0.bar. Ce processus peut tre vrifi via linterface Bonita.

Pour reproduire ce scnario, procdez comme suit : Dposez les composants tBonitaDeploy, tFixedFlowInput et tBonitaInstantiateProcess de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le composant tBonitaDeploy pour ouvrir son menu contextuel. Slectionnez Trigger > On Subjob Ok pour relier le tBonitaDeploy au tFixedFlowInput. Cliquez-droit sur le tFixedFlowInput pour ouvrir son menu contextuel et slectionnez Row > Main pour relier ce composant au tBonitaInstantiateProcess, laide dun lien Main. Double-cliquez sur le tBonitaDeploy afin douvrir sa vue Basic settings.

Dans la zone Bonita Runtime Configuration, parcourez votre rpertoire de fichiers de variables Bonita Runtime. Dans le champ Bonita Runtime Environment file, parcourez votre rpertoire jusquau fichier bonita-environnement.xml.

16

Guide de Rfrence des Composants Talend Open Studio

Scnario : Excuter un processus Bonita via un Job Talend

Dans le champ Bonita Runtime Jaas File, parcourez votre rpertoire jusquau fichier jaas-standard.cfg. Dans le champ Bonita Runtime Logging File, parcourez votre rpertoire jusquau fichier logging.properties. Dans le champ Business Archive, parcourez votre rpertoire jusquau fichier Bonita .bar, qui est le processus export de votre systme Bonita et sera dploy dans le moteur Bonita Runtime. Dans les champs Username et Password, saisissez vos informations de connexion Bonita. Double-cliquez sur le composant tFixedFlowInput afin douvrir sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema pour ouvrir lditeur du schma.

Dans lditeur du schma, cliquez sur le bouton [+] pour ajouter une ligne. Cliquez sur la nouvelle ligne et saisissez son nom : name. Cliquez sur OK. Dans la zone Mode de la vue Basic settings, slectionnez loption Use inline table. Sous le tableau, cliquez sur le bouton [+] afin dajouter une ligne. Dans le tableau, cliquez sur la ligne ajoute et saisissez entre guillemets le nom de la personne de votre personnel : ychen, dont la requte sera traite par le processus dploy.

Guide de Rfrence des Composants Talend Open Studio

17

Scnario : Excuter un processus Bonita via un Job Talend

Double-cliquez sur le tBonitaInstantiateProcess afin douvrir sa vue Basic settings.

Dans la vue Basic settings, cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent. Dans la zone Bonita Runtime Configuration, parcourez votre rpertoire de fichiers de variables Bonita Runtime. Dans le champ Bonita Runtime Environment file, parcourez votre rpertoire jusquau fichier bonita-environnement.xml. Dans le champ Bonita Runtime Jaas File, parcourez votre rpertoire jusquau fichier jaas-standard.cfg. Dans le champ Bonita Runtime Logging File, parcourez votre rpertoire jusquau fichier logging.properties. Cochez la case Use Process ID pour activer le champ Process Definition Id. Dans le champ Process Definition Id, cliquez entre les guillemets et appuyez sur Ctrl+Espace afin douvrir la liste dautocompltion contenant les variables globales disponibles pour ce Job. Double-cliquez sur la variable que vous souhaitez utiliser pour lajouter entre les guillemets. Dans ce scnario, double-cliquez sur tBonitaDeploy_1_ProcessDefinitionUUID, qui rcupre lID de dfinition du processus dploy par le composant tBonitaDeploy. Si le processus a t dploy et que le tBonitaDeploy nest pas utilis, dcochez la case Use Process ID afin dactiver les champs Process name et Process version et remplir les informations correspondantes. Le tBonitaInstantiateProcess concatne le nom et la version du processus que vous avez saisis lors de la construction de lID du processus. Dans les champs Username et Password, saisissez respectivement votre identifiant et votre mot de passe de connexion Bonita. Appuyez sur F6 pour excuter le Job.

18

Guide de Rfrence des Composants Talend Open Studio

Scnario : Excuter un processus Bonita via un Job Talend

Le processus est dploy dans le moteur Bonita Runtime et une instance est cre pour les requtes concernant le personnel.

Guide de Rfrence des Composants Talend Open Studio

19

tCentricCRMInput

tCentricCRMInput

Proprits du tCentricCRMInput
Famille du composant Fonction Objectif Basic settings Business/CentricCRM Le composant tCentricCRMInput se connecte un module de la base de donnes CentricCRM via le service Web adquat. Le tCentricCRMInput permet dextraire les donnes dune base de donnes Centric CRM laide dune requte. CentricCRM URL Module Server UserID et Password Saisissez lURL du service Web permettant de se connecter la base de donnes CentricCRM. Slectionnez le module adquat dans la liste. Saisissez ladresse IP du serveur de base de donnes. Saisissez les informations dauthentification de lutilisateur au service Web.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Query condition Advanced settings tStatCatcher Statistics Saisissez la requte permettant de slectionner les donnes extraire. Cochez cette case pour collecter les mtadonnes de traitement du Job au niveau du Job ainsi quau niveau de chaque composant.

Utilisation Limitation

Ce composant est gnralement utilis en tant que composant de dbut. Un composant de sortie est ncessaire. n/a

Scnario associ
Aucun scnario nest disponible pour ce composant.

20

Guide de Rfrence des Composants Talend Open Studio

tCentricCRMOutput

tCentricCRMOutput

Proprits du tCentricCRMOutput
Famille du composant Fonction Objectif Basic settings Business/CentricCRM Le composant tCentricCRMOutput crit dans un module de la base de donnes CentricCRM via le service Web adquat. Le tCentricCRMOutput permet dcrire des donnes dans une base de donnes CentricCRM. CentricCRM URL Module Server UserID et Password Action Saisissez lURL du service Web permettant de se connecter la base de donnes CentricCRM. Slectionnez le module adquat dans la liste. Saisissez ladresse IP du serveur de base de donnes. Saisissez les informations dauthentification de lutilisateur au service Web. Vous pouvez effectuer lune des oprations suivantes sur les donnes du module CentricCRM : Insert : insrer les donnes. Update : mettre les donnes jour. Delete : supprimer les donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Advanced settings tStatCatcher Statistics Cochez cette case pour collecter les mtadonnes de traitement du Job au niveau du Job ainsi quau niveau de chaque composant.

Utilisation Limitation

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

21

tHL7Input

tHL7Input

Proprits du tHL7Input
Famille de composant Fonction Objectif Business > Healthcare / Unstructured > HL7 Lit un fichier de structure HL7 et extrait des donnes ligne par ligne. Ce composant lit un fichier HL7 structur ou un flux de donnes ligne par ligne pour le scinder en champs et envoie les champs tels que dfinis dans le schma au composant suivant du Job via une connexion Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant connexion de base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Multi Schemas Editor Lditeur [Multi Schema Editor] vous permet de construire et de configurer le flux de donnes dans un fichier dlimit multi-structure, pour associer un schma par sortie. Connection : Les colonnes sont automatiquement rcupres partir du fichier dentre. Le nom de la colonne est le nom du segment. Column Mapping : Dans ce tableau, le mapping est rcupr de celui que vous avez dfini dans lditeur. Not Validate HL7 Mes- Cochez cette case si vous ne souhaitez pas valider les sage messages HL7. Advanced settings Advanced separator Cochez cette option pour modifier les sparateurs utili(for numbers) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Encoding Slectionnez le type dencodage partir de la liste ou choisissez loption Custom pour le dfinir manuellement. Ce champ doit obligatoirement tre renseign.

Basic settings

Segment Lists

22

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retrouver des informations concernant les patients et les vnements partir dun fichier HL7

tStatCatcher Statistics Utilisation Limitation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Gnralement utilis en tant que composant dentre. Un composant de sortie est requis. n/a

Scnario : Retrouver des informations concernant les patients et les vnements partir dun fichier HL7
Ce scnario dcrit un Job de quatre composants, dont le but est de retrouver des informations concernant des patients et des vnements partir dun fichier HL7.

A partir de la Palette, glissez-dposez un composant tHL7Input, et trois tLogRow dans lespace de modlisation graphique. Double-cliquez sur le composant tHL7Input afin douvrir son diteur.

Guide de Rfrence des Composants Talend Open Studio

23

Scnario : Retrouver des informations concernant les patients et les vnements partir dun fichier HL7

Dans le champ File path, cliquez sur [Browse...], parcourez votre rpertoire, et slectionnez votre fichier HL7. Dans la zone File Setting, saisissez le caractre de dbut de votre segment (Start character), et le caractre de fin de votre segment (End character). Dans la zone Schema View, dans la liste Segment(As Schema), slectionnez MSH. Glissez-dposez les segments MSH-3(1)[HD] et MSH-7(1)[TS] de la zone Message View dans la zone Schema View.

Dans la zone Schema View, dans la liste Segment(As Schema), slectionnez EVN. Glissez dposez les segments EVN-1(1)-1-1[ID] et EVN-2(1)-1-1[ST] de la zone Message View dans la zone Schema View.

24

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retrouver des informations concernant les patients et les vnements partir dun fichier HL7

Dans la zone Schema View, dans la liste Segment(As Schema), slectionnez PID. Glissez-dposez les segments suivants de la zone Message View dans la zone Schema View : PID-1(1)-1-1[SI], PID-5(1)-1-1[ST], PID-5(1)-2-1[ST], PID-5(1)-3-1[ST], PID-5(1)-4-1[ST], PID-5(1)-5-1[ST], PID-5(1)-7-1[ID]. Sil est disponible, utilisez le bouton Auto map! situ en bas gauche de la fentre, il permet deffectuer lopration de mapping automatiquement. Cliquez sur Ok afin de fermer lditeur. Reliez le tHL7Input aux trois tLogRow, en utilisant respectivement les liens MSH, EVN et PID. Sauvegardez votre Job, et appuyez sur F6 pour lexcuter.

La console affiche les trois tables des tLogRow, qui retournent diffrents types dinformations. La premire montre len-tte du message et sa date. La seconde retourne les informations concernant le patient. La troisime affiche lID de lvnement ainsi que sa date.

Guide de Rfrence des Composants Talend Open Studio

25

tHL7Output

tHL7Output

Proprits du tHL7Output
Famille de composant Fonction Objectif Basic settings Business > Healthcare / Unstructured > HL7 Ecrit un fichier de structure HL7 et insre des donnes ligne par ligne. Ce composant crit un fichier HL7 structur selon la norme HL7. Property type Peut tre Built-In ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema(s) Schema : Dfinissez le nud o stocker les donnes de la ligne parente. Parent row : Flux de donnes source. File Stream Name/Output Parcourez le rpertoire o stocker les fichiers gnrs. Ouvre linterface ddie pour vous aider mettre en place le mapping HL7. Slectionnez dans la liste votre version de HL7.

Configure HL7 Tree HL7 version Advanced settings

Create directory only if Cette case est coche par dfaut. Cette option permet de not exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Encoding Slectionnez le type dencodage partir de la liste ou choisissez loption Custom pour le dfinir manuellement. Ce champ doit obligatoirement tre renseign. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Gnralement utilis en tant que composant de sortie. Un composant dentre est requis. n/a

Scnario associ
Pour un scnario utilisant un autre composant HL7, consultez le composant tHL7Input.

26

Guide de Rfrence des Composants Talend Open Studio

tMarketoInput

tMarketoInput

Proprits du tMarketoInput
Famille de composant Fonction Objectif Basic settings Business/Cloud Le composant tMarketoIntput rcupre des donnes partir dun serveur Web Marketo. Ce composant vous permet de rcuprer des donnes partir dune base de donnes Marketo sur un serveur Web. Endpoint address Secret key URL du service Web Marketo appel par lAPI ou les APIs SOAP. Saisissez le code dauthentification crypt fourni par Marketo. Pour obtenir cette information, veuillez contacter le support Marketo via support@marketo.com . Client Access ID Saisissez lidentifiant utilisateur permettant daccder au service Web Marketo. Pour obtenir cette information, veuillez contacter le support Marketo via support@marketo.com . Operation Les options de cette liste vous permettent de synchroniser les donnes des prospects entre Marketo et un systme externe. getLead : Cette option rcupre les informations des prospects et de leur activit dans la base de donnes Marketo. getMultipleLeads : Cette opration rcupre les enregistrements des prospects dans des lots. getLeadActivities : Cette opration rcupre lhistorique des enregistrements dactivit pour un prospect unique identifi par la cl fournie. getLeadChanges : Cette opration vrifie les changements des donnes de prospects dans la base de donnes Marketo. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository.

Guide de Rfrence des Composants Talend Open Studio

27

Proprits du tMarketoInput

Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Columns Mapping Vous pouvez configurer les conditions de mapping en modifiant le schma dans Edit Schema. Par dfaut, les noms des colonnes des champs contenus dans Column sont les mmes que ceux du schma. Puisque certains noms de colonnes de la base de donnes Marketo contiennent des blancs non accepts par le schma du composant, vous devez spcifier les champs de colonnes correspondants dans le champ Columns in Marketo. Si les noms de colonnes dfinis dans le schma sont les mmes que ceux de la base de donnes Marketo, comme par exemple "Email", alors il nest pas ncessaire de configurer les conditions de mapping. LeadKey type LeadKey value Set Include Types Types de donnes de LeadKey supports par la base de donnes Marketo. Valeur de LeadKey. Cochez cette case pour inclure les types de contenu de lactivit des prospects (LeadActivity) rcuprer. Cliquez sur le bouton [+] sous la zone Include Types pour ajouter des types en les slectionnant dans la liste. Cette case est disponible uniquement si vous avez slectionn getLeadActivity ou getLeadChanges dans la liste Operation. Set Exclude Types Cochez cette case pour exclure les types de contenu de lactivit des prospects (LeadActivity) rcuprer. Cliquez sur le bouton [+] sous la zone Exclude Types pour ajouter des types en les slectionnant dans la liste. Cette case est disponible uniquement si vous avez slectionn getLeadActivity ou getLeadChanges dans la liste Operation. Last Updated At Saisissez la date de la dernire mise jour afin de ne rcuprer que les donnes datant de la priode spcifie. Le format de date est YYYY-MM-DD HH:MM:SS. Ce champ est disponible uniquement si vous avez slectionn getMultipleLeads dans la liste Operation.

28

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Batch Size

Limite maximale du nombre des donnes de prospects rcuprer par lot. Ce champ est disponible uniquement si vous avez slectionn lopration syncMultipleLeads.

Timeout (milliseconds) Saisissez en millisecondes le dlai avant suspension de la requte sur le service Web Marketo. Le Job sarrte lorsque lerreur Timeout exception survient. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Au besoin, vous pouvez rcuprer les lignes en erreur via un lien Row > Reject. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis en tant que composant de dentre. Un composant de sortie est ncessaire. n/a

Scnario associ
Pour un scnario associ, consultez le composant tMarketoOutput.

Guide de Rfrence des Composants Talend Open Studio

29

tMarketoListOperation

tMarketoListOperation

Proprits du tMarketoOutput
Famille de composant Fonction Business/Cloud Le composant tMarketoListOperation ajoute/supprime un ou plusieurs prospect(s) dans une liste de la base de donnes Marketo. Il vrifie galement si un ou plusieurs prospect(s) existe(nt) dans cette liste. Ce composant vous permet dajouter ou de supprimer un ou plusieurs prospect(s) dans une liste de la base de donnes Marketo. Vous pouvez galement vrifier lexistence dun ou plusieurs prospect(s) dans la liste. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Endpoint address Secret key URL du service Web Marketo appel par lAPI ou les APIs SOAP. Saisissez le code dauthentification crypt fourni par Marketo. Pour obtenir cette information, veuillez contacter le support Marketo via support@marketo.com . Client Access ID Saisissez lidentifiant utilisateur permettant daccder au service Web Marketo. Pour obtenir cette information, veuillez contacter le support Marketo via support@marketo.com . Operation Les options de cette liste vous permettent deffectuer un ajout/une suppression dun ou plusieurs prospect(s) dans une liste dune base de donnes Marketo. Vous pouvez galement vrifier lexistence dun ou plusieurs prospect(s) dans une liste de la base de donnes Marketo.

Objectif

Basic settings

30

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ajouter un enregistrement de prospects dans une liste de la base de donnes Marketo

addTo : Cette option ajoute un ou plusieurs prospect(s) dans une liste de la base de donnes Marketo. isMemberOf : Cette option recherche dans la base de donnes si le(s) prospect(s) spcifique(s) existe(nt) dans la base de donnes. removeFrom : cette opration supprime un ou plusieurs prospect(s) dune liste dans la base de donnes Marketo. Add or remove multiple Cochez cette case afin dajouter ou de supprimer pluleads sieurs prospect(s) dune liste dans la base de donnes Marketo. Cette case est disponible uniquement si vous avez slectionn addTo ou removeFrom dans la liste Operation. Timeout (milliseconds) Saisissez en millisecondes le dlai avant suspension de la requte sur le service Web Marketo. Le Job sarrte lorsque lerreur Timeout exception survient. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Au besoin, vous pouvez rcuprer les lignes en erreur via un lien Row > Reject. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis en tant que composant intermdiaire. Un composant dentre et un composant de sortie sont ncessaires. n/a

Scnario : Ajouter un enregistrement de prospects dans une liste de la base de donnes Marketo
Le scnario suivant dcrit un Job a trois composants qui ajoute un enregistrement de prospects dans une liste de la base de donnes Marketo.

Dposez les composants tMarketoListOperation, tFixedFlowInput et tLogRow de la Palette dans lespace de modlisation graphique. Connectez le tFixedFlowInput au tMarketoListOperation laide dun lien Row > Main. Connectez le tMarketoListOperation au tLogRow laide dun lien Row > Main.

Guide de Rfrence des Composants Talend Open Studio

31

Scnario : Ajouter un enregistrement de prospects dans une liste de la base de donnes Marketo

Double-cliquez sur le composant tFixedFlowInput afin de dfinir ses proprits dans sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema pour dfinir manuellement le schma.

Cliquez sur le bouton [+] afin dajouter quatre colonnes : ListKeyType, ListKeyValue, LeadKeyType et LeadKeyValue. Laissez leurs paramtres par dfaut. Cliquez sur OK pour sauvegarder la configuration. Dans la zone Mode, slectionnez Use Inline Table. Cliquez sur le bouton [+] pour ajouter une ligne, puis remplissez-la avec les valeurs respectives. Dans cet exemple, ces valeurs sont : MKTOLISTNAME pour ListKeyType, bchenTestList pour ListKeyValue, IDNUM pour LeadKeyType et 308408 pour LeadKeyValue. Double-cliquez sur le composant tMarketoListOperation pour dfinir ses proprits dans la vue Basic settings.

32

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ajouter un enregistrement de prospects dans une liste de la base de donnes Marketo

Cliquez sur le bouton Sync columns afin de rcuprer le schma dfini dans le tFixedFlowInput. Saisissez 1 dans le champ Number of rows. Dans le champ Endpoint address, saisissez lURL du serveur Web Marketo. Dans cet exemple, saisissez https://na-c.marketo.com/soap/mktows/1_5. Notez que lURL utilise dans ce scnario a pour but la dmonstration uniquement. Dans le champ Secret key, saisissez le code dauthentification crypt fourni par Marketo. Dans cet exemple, le code est 464407637703554044DD11AA2211998. Saisissez lID de lutilisateur dans le champ Client Access ID. Dans cet exemple, lID est mktodemo41_785133934D1A219. Dans la liste Operation, slectionnez addTo. Saisissez la limite avant suspension de la requte dans le champ Timeout. Dans cet exemple, utilisez le dlai par dfaut : 60000. Double-cliquez sur le composant tLogRow afin de configurer ses proprits dans la vue Basic settings.

Cliquez sur le bouton Sync columns pour rcuprer le schma dfini dans le composant tMarketoListOperation. Dans la zone Mode, slectionnez Table. Sauvegardez votre Job et appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

33

Scnario : Ajouter un enregistrement de prospects dans une liste de la base de donnes Marketo

Lajout dun enregistrement de prospects dans une liste de la base de donnes Marketo est affich dans la console de la vue Run.

34

Guide de Rfrence des Composants Talend Open Studio

tMarketoOutput

tMarketoOutput

Proprits du tMarketoOutput
Famille de composant Fonction Objectif Basic settings Business/Cloud Le composant tMarketoOutput envoie des donnes vers un serveur Web Marketo. Ce composant vous permet dcrire des donnes dans une base de donnes Marketo sur un serveur Web. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Endpoint address Secret key URL du service Web Marketo appel par lAPI ou les APIs SOAP. Saisissez le code dauthentification crypt fourni par Marketo. Pour obtenir cette information, veuillez contacter le support Marketo via support@marketo.com . Client Access ID Saisissez lidentifiant utilisateur permettant daccder au service Web Marketo. Pour obtenir cette information, veuillez contacter le support Marketo via support@marketo.com . Operation Les options de cette liste vous permettent de synchroniser les donnes des prospects entre Marketo et un systme externe. syncLead : Cette option sollicite une opration dinsertion ou de mise jour pour un enregistrement de prospect.

Guide de Rfrence des Composants Talend Open Studio

35

Proprits du tMarketoOutput

syncMultipleLeads : Cette option sollicite une opration dinsertion ou de mise jour pour plusieurs enregistrements de prospects regroups par lots. Columns Mapping Vous pouvez configurer les conditions de mapping en modifiant le schma dans Edit Schema. Par dfaut, les noms des colonnes des champs contenus dans Column sont les mmes que ceux du schma. Puisque certains noms de colonnes de la base de donnes Marketo contiennent des blancs non accepts par le schma du composant, vous devez spcifier les champs de colonnes correspondants dans le champ Columns in Marketo. Si les noms de colonnes dfinis dans le schma sont les mmes que ceux de la base de donnes Marketo, comme par exemple "Email", alors il nest pas ncessaire de configurer les conditions de mapping. De-duplicate lead re- Cochez cette case afin de ddoublonner et de mettre cord on email address jour les enregistrements des prospects en utilisant ladresse e-mail. Dcochez cette case si vous souhaitez crer un autre enregistrement de prospect contenant la mme adresse email. Cette case est disponible uniquement si vous avez slectionn syncMultipleLeads dans la liste Operation. Batch Size Limite maximale du nombre denregistrements par lot synchroniser avec les donnes de prospects. Ce champ est disponible uniquement si vous avez slectionn syncMultipleLeads dans la liste Operation. Timeout (milliseconds) Saisissez en millisecondes le dlai avant suspension de la requte sur le service Web Marketo. Le Job sarrte lorsque lerreur Timeout exception survient. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Au besoin, vous pouvez rcuprer les lignes en erreur via un lien Row > Reject. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis en tant que composant de sortie. Un composant dentre est ncessaire. n/a

36

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer et rcuprer des donnes dune base de donnes Marketo via un systme externe

Scnario : Insrer et rcuprer des donnes dune base de donnes Marketo via un systme externe
Le scnario suivant dcrit un Job cinq composants qui a pour but dinsrer des enregistrements de prospects dans une base de donnes Marketo et dcrire ces enregistrements dans un fichier local. Au terme de ce processus, le nombre dappels dAPI est affich dans la console de la vue Run.

A partir de la Palette, dposez les composants tMarketoOutput, tMarketoInput, tFileInputDelimited, tFileOutputDelimited et tJava dans lespace de modlisation graphique. Connectez le composant tFileInputDelimited au tMarketoOutput laide dun lien Row > Main. Connectez le composant tMarketoInput au tFileOutputDelimited laide dun lien Row > Main. Connectez le composant tFileInputDelimited au tMarketoInput laide dun lien Trigger > OnSubjectOk. Connectez le composant tMarketoInput au tJava laide dun lien Trigger > OnSubjectOk. Double-cliquez sur le composant tFileInputDelimited pour afficher longlet Basic settings de sa vue Component et dfinir ses proprits.

Cliquez sur le bouton [...] ct du champ File name/Stream et slectionnez un fichier local pour linsertion de donnes. Pour ce scnario, il sagit de D:/SendData.csv. Cliquez sur le bouton [...] ct du champ Edit schema pour configurer le schma manuellement.

Guide de Rfrence des Composants Talend Open Studio

37

Scnario : Insrer et rcuprer des donnes dune base de donnes Marketo via un systme externe

Cliquez sur le bouton [+] pour ajouter quatre colonnes : Id, Email, ForeignSysPersonId et ForeignSysType. Configurez le Type de Id Integer et laissez les autres colonnes telles quelles sont. Cliquez ensuite sur OK pour enregistrer les paramtres. Dans le champ Header, saisissez 1 et laissez les autres paramtres tels quils sont. Double-cliquez sur le composant tMarketoOutput pour afficher longlet Basic settings de sa vue Component et dfinir ses proprits.

Cliquez sur le bouton Sync columns pour rcuprer le schma dfini dans le composant tFileInputDelimited. Renseignez le champ Endpoint address avec ladresse URL du serveur Web Marketo. Pour ce scnario, saisissez https://na-c.marketo.com/soap/demo/demo1. Notez que lURL utilise dans ce scnario est essentiellement destine la dmonstration. Renseignez le champ Secret key avec le code dauthentification crypt fourni par Marketo. Pour ce scnario, saisissez 1234567894DEMOONLY987654321.

38

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer et rcuprer des donnes dune base de donnes Marketo via un systme externe

Renseignez le champ Client Access ID avec lidentifiant utilisateur. Pour ce scnario, saisissez mktodemo1_1234567894DEMOONLY987654321. A partir de la liste Operation, slectionnez syncMultipleLeads. Saisissez le dlai (en millisecondes) avant suspension de la requte dans le champ Timeout (milliseconds). Pour ce scnario, utilisez la valeur par dfaut : 600000. Double-cliquez sur le composant tMarketoInput afin dafficher longlet Basic settings de sa vue Component et dfinir ses proprits.

Dans la liste Operation, slectionnez getLead. Dans le tableau Columns Mapping, saisissez test@talend.com dans la colonne Columns in Marketo correspondant la colonne Email. Notez que les donnes utilises dans ce scnario sont essentiellement destines la dmonstration. Dans la liste LeadKey type, slectionnez EMAIL et saisissez test@talend.com dans le champ LeadKey value. Laissez les autres paramtres tels quils sont dans le composant tMarketoOutput. Double-cliquez sur le composant tFileOutputDelimited pour afficher longlet Basic settings de sa vue Component et dfinir ses proprits.

Cliquez sur le bouton [...] ct du champ File name pour synchroniser les donnes dans un fichier local. Dans ce scnario, le chemin daccs au fichier est D:/ReceiveData.csv.

Guide de Rfrence des Composants Talend Open Studio

39

Scnario : Insrer et rcuprer des donnes dune base de donnes Marketo via un systme externe

Cliquez sur le bouton Sync columns et laissez les autres paramtres tels quils sont. Double-cliquez sur le composant tJava pour ajouter du code dans longlet Basic settings de sa vue Component.

Dans le champ Code, saisissez le code suivant afin de compter le nombre dappels dAPI effectus pendant les oprations sur les donnes : System.out.println(("The Number of API calls for inserting data to Marketo DB is:")); System.out.println((Integer)globalMap.get("tMarketoOutput_1_NB_CALL")); System.out.println(("The Number of API calls for data synchronization from Marketo DB is:")); System.out.println((Integer)globalMap.get("tMarketoInput_1_NB_CALL")); Sauvegardez votre Job et appuyez sur F6 pour lexcuter.

Les enregistrements des prospects insrs dans la base de donnes Marketo sont crits dans le fichier D:/ ReceiveData.csv.

Le nombre total dappels dAPIs durant les oprations sur les donnes est affich dans la console de la vue Run.

40

Guide de Rfrence des Composants Talend Open Studio

tMicrosoftCRMInput

tMicrosoftCRMInput

Proprits du tMicrosoftCRMInput
Famille de composant Fonction Objectif Basic settings Business Le composant tMicrosoftCRMInput se connecte une entit de la base de donnes MicrosoftCRM via le service Web adquat. Ce composant permet dextraire les donnes dune base MicrosoftCRM selon certaines conditions dfinies dans des colonnes spcifiques. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Microsoft URL Webservice Saisissez lURL du service Web permettant de se connecter la base de donnes Microsoft CRM. Renseignez le nom de lutilisateur ou de lorganisme, dfini par un administrateur, qui veut accder la base de donnes MicrosoftCRM.

Organizename

Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Domain Host Port Time out (seconds) Entity Saisissez le nom de domaine du serveur sur lequel est hberge la base MicrosoftCRM. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nombre de secondes dcoute du port avant sa fermeture. Slectionnez lentit adquate partir de la liste droulante.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Si vous effectuez des modifications, le schma passera automatiquement en built-in. Pour ce composant, le schma correspond lentit slectionne. Logical operators used Si vous souhaitez combiner le filtrage simple et le mode to combine conditions avanc, slectionnez loprateur permettant de combiner les deux modes. Conditions Les conditions sont excutes les unes aprs les autres pour chaque ligne.

Guide de Rfrence des Composants Talend Open Studio

41

Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques Input column : Cliquez dans la cellule et slectionnez la colonne du schma dentre laquelle attribuer la condition. Operator : Cliquez dans la cellule et slectionnez loprateur pour relier la valeur la colonne du schma. Value : Saisissez la valeur filtre entre guillemets, si ncessaire. Cliquez sur le bouton [+] pour ajouter autant de conditions que vous le souhaitez. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis en tant que composant de dbut. Un composant de sortie est ncessaire. n/a

Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques
Le scnario suivant dcrit un Job quatre composants qui a pour but lcriture des donnes dun fichier dlimit en entre dans une entit personnalise dune base de donnes MicrosoftCRM . Le Job permet ensuite dextraire des lignes spcifiques jusque dans un fichier de sortie, en utilisant les conditions dfinies sur certaines colonnes dentre. Si vous voulez crire dans une Entit Personnalise dune base de donnes MicrosoftCRM, assurez-vous de nommer les colonnes conformment aux rgles de syntaxe Microsoft, savoir name_columnname en minuscules. A partir de la Palette, dposez les composants suivants dans lditeur graphique : tFileInputdelimited, tFileOutputDelimited, tMicrosoftCRMInput, et tMicrosoftCRMOutput.

Connectez le composant tFileInputDelimited au tMicrosoftCRMOutput laide dun lien de type Row Main. Connectez le composant tMicrosoftCRMIntput au tFileOutputDelimited laide dun lien de type Row Main.

42

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques Connectez le composant tFileInputDelimited au tMicrosoftCRMInput laide dun lien de type OnSubjobOk. Double-cliquez sur le composant tFileInputDelimited pour afficher la vue Basic settings et configurer ses paramtres de base.

Slectionnez le mode Repository partir de la liste droulante Property Type si vous avez stock les paramtres du fichier dentre sous le nud Metadata de larborescence Repository. Dans le cas contraire, slectionnez le mode Built-In et remplissez manuellement les champs correspondants. Dans cet exemple, les proprits sont dfinies en mode Built-In. Cliquez sur le bouton [...] ct du champ File Name/Input Stream et parcourez vos dossiers jusquau fichier dlimit contenant les donnes dentre. Dans cet exemple, le fichier dentre comprend les colonnes suivantes : new_id, new_status, new_firstname, new_email, new_city, new_initial et new_zipcode.

Dans le champ Row separator, dfinissez le sparateur de lignes permettant didentifier les fins de ligne. De mme, pour Field separator, dfinissez le sparateur de champs permettant de dlimiter les diffrents champs pour chaque ligne. Dfinissez, si ncessaire, le nombre de lignes den-tte (Header) et de pied-de-page (Footer) ignorer, ainsi que le nombre maximum de lignes (Limit) que vous souhaitez traiter. Dans cet exemple, aucun de ces trois champs ne sont dfinis. Cliquez sur Edit schema pour ouvrir une bote de dialogue dans laquelle vous pouvez dfinir le schma dentre que vous voulez crire dans la base de donnes MicrosoftCRM.

Guide de Rfrence des Composants Talend Open Studio

43

Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques

Cliquez sur OK pour fermer la bote de dialogue. Double-cliquez sur le composant tMicrosoftCRMOutput pour afficher la vue Basic settings et configurer ses paramtres de base.

Dans le champ Microsoft Web Service URL, saisissez lURL du serveur Web Microsoft. Renseignez ensuite le nom (Username) ainsi que le mot de passe (Password) correspondants. Dans le champ OrganizeName, saisissez lidentifiant qui porte les droits daccs la base de donnes MicrosoftCRM. Dans le champ Domain, renseignez le nom de domaine du serveur sur lequel la base de donnes MicrosoftCRM est hberge. Saisissez ensuite ladresse IP (Host) et le numro de port dcoute (Port) du serveur. A partir de la liste droulante Action, slectionnez lopration que vous voulez effectuer. Dans cet exemple, le but est dinsrer (Insert) des donnes dans une entit personnalise sur la base MicrosoftCRM. Dans le champ Time out, dfinissez la limite de temps (en secondes) aprs laquelle le Job sarrte automatiquement.

44

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques Dans la liste Entity, slectionnez lune des options proposes. Dans cet exemple, cest loption CustomEntity qui est slectionne. Lorsque loption CustomEntity est slectionne, le champ Custom Entity Name apparat, dans lequel vous devez saisir le nom de lentit personnalise. Le Schema est alors dfini de manire automatique, en fonction de lentit slectionne. Cliquez si ncessaire sur le bouton Edit schema pour afficher une bote de dialogue partir de laquelle vous pouvez modifier ce schma et retirer les colonnes dont vous navez pas besoin en sortie. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent.

Double-cliquez sur le composant tMicrosoftCRMInput pour afficher la vue Basic settings et configurer ses paramtres de base.

Guide de Rfrence des Composants Talend Open Studio

45

Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques

Slectionnez le mode Repository partir de la liste droulante Property Type si vous avez stock les paramtres du fichier dentre sous le nud Metadata de larborescence Repository. Dans le cas contraire, slectionnez le mode Built-In et remplissez manuellement les champs correspondants. Dans cet exemple, les proprits sont dfinies en mode Built-In. Dans le champ Microsoft Web Service URL, saisissez lURL du serveur Web Microsoft. Renseignez ensuite le nom (Username) ainsi que le mot de passe (Password) correspondants. Dans le champ OrganizeName, saisissez lidentifiant qui porte les droits daccs la base de donnes MicrosoftCRM. Dans le champ Domain, renseignez le nom de domaine du serveur sur lequel la base de donnes MicrosoftCRM est hberge. Saisissez ensuite ladresse IP (Host) et le numro du port dcoute (Port) du serveur. Dans le champ Time out, dfinissez la limite de temps (en secondes) aprs laquelle le Job sarrte automatiquement. Dans la liste Entity, slectionnez lune des options proposes. Dans cet exemple, cest loption CustomEntity qui est slectionne. Le Schema est alors dfini de manire automatique, en fonction de lentit slectionne, mais vous pouvez le modifier si ncessaire. Dans cet exemple, pour accder lentit personnalise, il faut dfinir le schma manuellement. Copiez le schma sept colonnes partir du composant tMicrosoftCRMOutput et collez-le dans la bote de dialogue du tMicrosoftCRMInput.

46

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques

Cliquez sur le bouton OK pour fermer la bote de dialogue. Un message pop-up vous proposera de propager les modifications : cliquez sur le bouton Yes. Dans la vue Basic settings, slectionnez loprateur logique And ou Or utiliser pour combiner les conditions dfinies dans les colonnes dentre. Dans cet exemple, pour dfinir deux conditions sur deux colonnes dentre diffrentes, il faut utiliser loprateur logique And. Dans la zone Condition, cliquez sur le bouton [...] pour ajouter autant de lignes que ncessaire, puis cliquez dans chaque ligne et slectionnez, partir de la liste droulante Input column, la colonne sur laquelle appliquer la condition. Dans cet exemple, les deux colonnes new-city et new_id portent des conditions. Le but est dextraire toutes les lignes concernant les clients dont la ville correspond New York et dont lidentifiant est suprieur 2. Cliquez dans chaque ligne et slectionnez, partir de la liste droulante Operator, loprateur utiliser pour relier la colonne dentre avec sa valeur associe. Dans cet exemple, loprateur Equal est slectionn pour la colonne new_city et Greater Than pour new_id. Cliquez dans chaque ligne et dfinissez, dans la colonne Value, la valeur des colonnes dentre : New York pour la colonne new_city et 2 pour new_id dans cet exemple. Il est possible dutiliser une valeur fixe aussi bien quune valeur de contexte dans ce champ. Double-cliquez sur le composant tFileOutputdelimited pour afficher la vue Basic settings et configurer ses paramtres de base.

Slectionnez le mode Built-In partir de la liste droulante Property Type puis cliquez sur le bouton [...] ct du champ pour parcourir vos dossiers jusquau fichier de sortie.

Guide de Rfrence des Composants Talend Open Studio

47

Scnario : Ecrire des donnes dans une base de donnes Microsoft CRM et attribuer des conditions aux colonnes pour extraire des lignes spcifiques Dfinissez les sparateurs de lignes (Row separator) et de champs (Field separator). Cochez la case Append pour ajouter des lignes la fin des entres de la base de donnes. Cochez la case Include Header si le fichier de sortie comprend un en-tte. Cliquez sur le bouton Sync columns pour rcuprer le schma partir du composant prcdent. Enregistrez votre Job puis cliquez sur F6 pour lexcuter.

Seuls les clients habitant la ville de New York, et dont lidentifiant est suprieur 2, apparaissent dans la liste du fichier de sortie stock en local.

48

Guide de Rfrence des Composants Talend Open Studio

tMicrosoftCRMOutput

tMicrosoftCRMOutput

Proprits du tMicrosoftCRMOutput
Famille de composant Fonction Objectif Basic settings Business Le composant tMicrosoftOutput crit dans un objet de la base de donnes MicrosoftCRM via le service Web adquat. Ce composant permet dcrire des donnes dans une base de donnes MicrosoftCRM. Authentication Type Microsoft URL Slectionnez le type d'authentification dans la liste, ON_PREMISE ou ONLINE.

Webservice Saisissez lURL du service Web permettant de se connecter la base de donnes MicrosoftCRM. Renseignez le nom de lorganisme qui veut accder la base de donnes MicrosoftCRM.

Organizename

Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Domain Host Port Action Saisissez le nom de domaine du serveur qui installe MicrosoftCRM. Adresse IP du serveur de base de donnes MicrosoftCRM. Numro du port dcoute du serveur de la base de donnes MicrosoftCRM. Vous pouvez effectuer lune des oprations suivantes sur les donnes MicrosoftCRM : Insert : insrer les donnes. Update : mettre les donnes jour. Delete : supprimer les donnes. Time out (seconds) Entity Nombre de secondes dcoute du port avant sa fermeture. Slectionnez lentit adquate partir de la liste droulante.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent.

Guide de Rfrence des Composants Talend Open Studio

49

Scnario associ

Lookup Type Mapping Ajoutez autant de lignes que ncessaire afin d'tablir le mapping entre les tables source et cible. Slectionnez un objet de rfrence dans la liste droulante Input column et saisissez le mot-cl des tables source dans le champ Type. Advanced settings Reuse Http Client tStatCatcher Statistics Usage Limitation Cochez cette case afin de conserver la connexion courante ou dcochez la case afin de librer la connexion. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Scnario associ
Pour un scnario associ, consultez le composant tMicrosoftCRMInput.

50

Guide de Rfrence des Composants Talend Open Studio

tMSAXInput

tMSAXInput

Proprits du tMSAXInput
Famille de composant Fonction Objectif Basic settings Business/ Microsoft AX Le composant tMSAXInput se connecte au serveur MicrosoftAX. Ce composant permet de lire les donnes dun serveur MicrosoftAX et d'effectuer des requtes sur ces donnes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Domain Adresse IP du serveur. Saisissez le nom de domaine sur lequel est hberg le serveur MicrosoftAX.

Username et Password Saisissez les informations dauthentification de lutilisateur. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Si vous effectuez des modifications, le schma passera automatiquement en built-in. Table Name Query Nom de la table lire. Saisissez votre requte SQL en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis en tant que composant de dbut. Un composant de sortie est ncessaire. n/a

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

51

tMSAXOutput

tMSAXOutput

Proprits du tMSAXOutput
Famille de composant Fonction Objectif Basic settings Business/ Microsoft AX Le composant tMSAXOutput se connecte au serveur MicrosoftAX. Ce composant permet dcrire les donnes dun serveur MicrosoftAX. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Domain Adresse IP du serveur. Saisissez le nom de domaine sur lequel est hberg le serveur MicrosoftAX.

Username et Password Saisissez les informations dauthentification de lutilisateur. Table Name Action on data Nom de la table crire. Vous pouvez effectuer nimporte quelle opration sur les donnes dun serveur MicrosoftAX. Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une cl de recherche sur laquelle baser les oprations Update et Delete. Il est possible de dfinir les colonnes qui agiront comme cl de recherche partir du schma, pour une utilisation de base, ou partir des options avances (Advanced settings) pour une utilisation optimise de ces oprations. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository.

52

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMSAXOutput

Cliquez sur Edit Schema pour modifier le schma. Si vous effectuez des modifications, le schma passera automatiquement en built-in. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Cette option vous permet dutiliser des expressions locales afin deffectuer des actions sur les colonnes. Par exemple, vous pouvez modifier les valeurs dans la table slectionne : Quand vous mettez jour ou que vous effacez des donnes dans une colonne, cette option vous fournit dautres possibilits concernant les clauses WHERE en utilisant diffrents oprateurs de la colonne Operator. Name : nom de la colonne du schma devant tre modifie ou insre comme nouvelle colonne. Operator : slectionnez dans la liste loprateur que vous souhaitez utiliser avec la clause WHERE. Cette colonne nest pas disponible quand vous utilisez Insert comme action sur les donnes. Data type : type de donnes. Local expression : type dexpression locale qui sera excut afin de modifier ou insrer la colonne de donnes correspondante, par exemple row1.[row name]. Ou bien appuyez sur Ctrl+Espace et slectionnez une variable de contexte dans la liste. Position : slectionnez dans la liste Before, After ou Replace, suivant laction que vous voulez excuter dans la colonne de rfrence. Reference column : type, dans une colonne de rfrence, que le composant peut utiliser pour insrer/remplacer la nouvelle colonne ou la colonne modifie. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Additional columns

Ce composant est gnralement utilis en tant que composant de sortie. Un composant de dbut est ncessaire. n/a

Guide de Rfrence des Composants Talend Open Studio

53

Scnario : Insrer des donnes dans une table dfinie sur le serveur Microsoft AX

Scnario : Insrer des donnes dans une table dfinie sur le serveur Microsoft AX
Avant de pouvoir utiliser ce composant, vrifiez que vous avez install et lanc le serveur Microsoft AX correctement. Ce scnario Java dcrit un Job deux composants qui utilise le composant tMSAXOutput afin dinsrer une ligne dans une table dfinie stocke sur un serveur Microsoft AX et modifie ensuite les valeurs dans lune des colonnes insre.

Glissez le composant tFixedFlowInput ainsi que le tMSAXOutput de la Palette dans lespace de modlisation. Connectez les composants laide dun lien Row de type Main. Double-cliquez sur le tFixedFlowInput afin dafficher la vue Component et de dfinir ses proprits.

Slectionnez le mode Built-In dans le champ Schema Type et cliquez sur le bouton [...] du champ Edit schema afin dafficher une bote de dialogue qui vous permettra de dfinir le schma dentre. Cliquez sur le bouton Plus vert pour ajouter des colonnes dans le schma dentre, trois dans cet exemple, name, city et street (nom, ville et rue). Cliquez sur OK pour fermer la bote de dialogue. Une nouvelle bote de dialogue souvre et vous demande si vous voulez propager les modifications, cliquez sur Yes (Oui). Les colonnes du schma saffichent automatiquement dans le tableau Values. Cliquez sur la colonne Value et saisissez une valeur pour chaque colonne dentre. Double-cliquez sur le tMSAXOutput pour ouvrir la vue Component et dfinir ses proprits.

54

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes dans une table dfinie sur le serveur Microsoft AX

Slectionnez le mode Built-In dans le champ Property Type. Dans le champ Host, saisissez ladresse IP du serveur MicrosoftAX. Dans le champ Domain, saisissez le nom du domaine qui hberge le serveur MicrosoftAX. Entrez votre nom dutilisateur et votre mot de passe de connexion au serveur dans les champs correspondants. Dans le champ Table Name, saisissez le nom de la table dans la quelle vous souhaitez crire des donnes. Dans la liste Action on data, slectionnez laction que vous dsirez excuter, Delete dans cet exemple. Cliquez sur Sync columns pour retrouver le schma du composant prcdent. Dans cet exemple, le but est de retrouver les trois colonnes dentre : name, city et street (nom, ville et rue). Si ncessaire, cliquez sur le bouton [...] du champ Edit schema afin douvrir une bote de dialogue qui vous permettra de vrifier le schma retourn. Dans le tableau Additional columns, cliquez sur le bouton [+] afin dajouter une ligne dans laquelle vous pouvez utiliser une expression locale pour modifier les donnes que vous voulez crire dans une colonne spcifique. Cliquez sur la colonne Local expression et appuyez sur Ctrl+Espace sur votre clavier pour ouvrir la liste des variables de contexte et slectionnez : StringHandling.UPCASE(row2.city)+-+row2.street. Cette expression crira le nom de la ville avec la premire lettre en majuscule, suivi du nom de la rue, pour former ladresse du Bryant park. La colonne address de cet exemple contiendra donc la chane de caractres suivante : New York-Midtown Manhattan. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Le tMSAXOutput insre dans la table ADDRESS du serveur MicrosoftAX une ligne contenant les trois colonnes dentre name, city et street, en plus de la nouvelle colonne address qui contient la fois le nom de la ville et le nom de la rue.

Guide de Rfrence des Composants Talend Open Studio

55

Scnario 2 : Effacer des donnes dune table prcise sur le serveur MicrosoftAX.

Scnario 2 : Effacer des donnes dune table prcise sur le serveur MicrosoftAX.
Avant de pouvoir utiliser ce composant, vrifiez que vous avez install et lanc correctement le serveur MicrosoftAX. Ce scnario Java dcrit un Job deux composants qui utilise le tMSAXOutput dans le but deffacer toutes les lignes dune table dfinie qui ne correspondent pas aux donnes contenues dans la colonne cl sur un serveur MicrosoftAX. Dans cet exemple, le schma dentre que vous utilisez est une colonne address (adresse) qui contient les donnes suivantes : New York-Midtown Manhattan. Vous allez effacer du serveur MicrosoftAX toutes les adresses qui ne sont pas identiques celle-ci.

Glissez les composants tFixedFlowInput et tMSAXOutput de la Palette dans lespace de modlisation. Connectez les deux composants laide dun lien Row de type Main. Double-cliquez sur le tFixedFlowInput pour afficher sa vue Component et dfinir ses proprits.

Slectionnez le mode Built-In dans le champ Schema Type et cliquez sur le bouton [...] du champ Edit schema pour ouvrir une bote de dialogue o vous pourrez dfinir le schma. Cliquez sur le bouton [+] et ajoutez les colonnes dentre du schma, address dans cet exemple. Cliquez sur OK pour fermer la bote de dialogue. Les colonnes du schma saffichent automatiquement dans la list Values. Cliquez sur la colonne Value et saisissez une valeur pour la colonne dentre. Double-cliquez sur le tMSAXOutput pour ouvrir sa vue Component et dfinir ses proprits.

56

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Effacer des donnes dune table prcise sur le serveur MicrosoftAX.

Slectionnez le mode Built-In dans le champ Property Type. Dans le champ Host, saisissez ladresse IP du serveur MicrosoftAX. Dans le champ Domain, entrez le nom du domaine qui hberge le serveur MicrosoftAX. Saisissez votre nom dutilisateur et votre mot de passe de connexion au serveur dans les champs correspondants. Dans le champ Table Name, saisissez le nom de la table dans laquelle vous voulez crire des donnes. Dans la liste Action on data, slectionnez laction que vos souhaitez excuter, Delete dans cet exemple. Cliquez sur Sync columns pour retourner le schma du composant prcdent. Dans cet exemple, lobjectif est de rcuprer la colonne dentre zipcode (code postal). Cliquez sur le bouton [...] du champ Edit Schema pour ouvrir la bote de dialogue dans laquelle vous pouvez vrifier le schma rcupr.

Dans le schma de sortie, cochez la case Key (cl) ct du nom de la colonne. Quand vous slectionnez une option diffrente de Insert, vous devez toujours dfinir la Reference column (colonne de rfrence) comme colonne cl.

Guide de Rfrence des Composants Talend Open Studio

57

Scnario 2 : Effacer des donnes dune table prcise sur le serveur MicrosoftAX.

Cliquez sur OK pour valider les changements et fermer la bote de dialogue. Dans le tableau Additional columns, cliquez sur le bouton [+] pour ajouter une ligne et dfinir les paramtres que le composant utilisera comme base pour lopration deffacement. Saisissez un nom (name), un oprateur (operator), un type de donnes (data type), une expression locale (local expression), une position (position) et une colonne de rfrence (reference column) dans les colonnes correspondantes la ligne que vous venez dajouter. Dans cet exemple, lobjectif est deffacer de la table ADDRESS du serveur MicrosoftAX toutes les lignes dans lesquelles la colonne Address nest pas identique ladresse dans la colonne cl address : New York-Midtown Manhattan. Quand vous slectionnez une action autre que Insert ,dans le champ Action on data vous devez toujours slectionner Replace dans la colonne Position. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Le tMSAXOutput supprime de la table ADDRESS du serveur MicrosoftAX toutes les lignes pour lesquelles les donnes de la colonne address ne sont pas identiques celles de la colonne cl.

58

Guide de Rfrence des Composants Talend Open Studio

tOpenbravoERPInput

tOpenbravoERPInput

Proprits du tOpenbravoERPInput
Famille de composant Fonction Objectif Basic settings Business Le composant tOpenbravoERPInput se connecte une entit de la base de donnes OpenbravoERP via le service Web adquat. Ce composant permet dextraire les donnes dune base OpenBravoERP selon certaines conditions dfinies dans des colonnes spcifiques. Openbravo REST Saisissez lURL du service Web permettant de se WebService URL connecter la base de donnes OpenbravoERP. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Entity Slectionnez lentit adquate partir de la liste droulante.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Si vous effectuez des modifications, le schma passera automatiquement en built-in. Pour ce composant, le schma correspond lentit slectionne. WHERE Clause Order by Saisissez votre clause WHERE. Cochez cette case afin de slectionner comment ordonner les rsultats (les lments de la liste droulante dpendent de lentit slectionne). Sort : Dans cette liste, vous pouvez choisir de trier vos rsultats de manire ascendante (Ascending) ou descendante (Descending). First result Max result Advanced settings Saisissez le numro de la ligne que vous souhaitez rcuprer en premier. Saisissez le nombre maximal de rsultats que vous souhaitez rcuprer.

Advanced separator Cochez cette option pour modifier les sparateurs utili(for numbers) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux.

Guide de Rfrence des Composants Talend Open Studio

59

Scnario associ

tStatCatcher Statistics Utilisation Limitation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis en tant que composant de dbut. Un composant de sortie est ncessaire. n/a

Scnario associ
Pour un scnario associ, consultez le composant tMicrosoftCRMInput.

60

Guide de Rfrence des Composants Talend Open Studio

tOpenbravoERPOutput

tOpenbravoERPOutput

Proprits du tOpenbravoERPOutput
Famille de composant Fonction Objectif Basic settings Business Le composant tOpenbravoERPOutput crit dans un objet de la base de donnes OpenbravoERP via le service Web adquat. Ce composant permet dcrire des donnes dans une base de donnes OpenbravoERP. Openbravo REST Web- Saisissez lURL du service Web permettant de se service URL connecter la base de donnes OpenbravoERP. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Action on data Slectionnez dans la liste si vous souhaitez mettre jour ou crer des donnes (Update/Create), ou si vous prfrez en supprimer (Remove). Cochez cette case afin de slectionner votre fichier en parcourant votre rpertoire. Slectionnez lentit adquate partir de la liste droulante.

Use existing data file Entity

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Advanced settings Usage Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Scnario associ
Pour un scnario associ, consultez le composant tMicrosoftCRMInput.

Guide de Rfrence des Composants Talend Open Studio

61

tSageX3Input

tSageX3Input

Proprits du tSageX3Input
Famille de com- Business/Sage posant X3 Fonction Objectif Basic settings Le composant tSageX3Input tire profit du Service Web fourni par un serveur Web Sage X3 pour extraire des donnes du systme Sage X3 (serveur X3). Le composant tSageX3Input extrait des donnes dun systme Sage X3 donn. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Si vous effectuez des modifications, le schma passera automatiquement en built-in. Endpoint dress Username Password Language Pool alias ad- Saisissez ladresse du Service Web fourni par le serveur Web Sage X3 donn. et Saisissez les informations dauthentification pour le Service Web, dfinies lors de la configuration du Serveur Web Sage X3. Saisissez le nom du code langue X3 utilis pour le dmarrage du groupe de connexions. Saisissez le nom du pool de connexion distribuant les requtes reues aux connexions disponibles. Ce nom est donn depuis la console de configuration Sage X3. Saisissez la chane de caractres de configuration si vous souhaitez rcuprer les informations de dbogage ou de traces. Par exemple, la chane de caractres peut tre : RequestConfigDebug=adxwss.trace.on=on; Si vous devez utiliser plusieurs chanes de caractres, sparez-les avec un &, par exemple, RequestConfigDebug=adxwss.trace.on=on&adxwss.trace.size=16384; Un outil tiers est ncessaire pour rcuprer ce type dinformations. Publication name Saisissez dans ce champ le nom de lobjet, de la liste ou du sous-programme publi(e) auquel/ laquelle vous souhaitez que votre Studio accde.

Request config

62

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser les cls des requtes pour extraire des donnes dun systme Sage X3 donn

Mapping

Remplissez ce tableau pour mapper les lments variables de lobjet, le sous-programme ou la liste dfini(e)(s) dans le serveur Web Sage X3 donn. Les colonnes complter incluent : Column : les colonnes dfinies dans lditeur de schma de ce composant. Group ID : lidentifiant de chaque groupe dlments variables. Par exemple, un groupe dlments variables peut reprsenter lun des attributs dun objet. Field name : le nom de chaque lment variable.

Query condition Cochez cette case pour paramtrer la (les) condition(s) de la requte. Les colonnes complter incluent : Key : le nom des lments variables utiliss comme cl de lextraction de donnes. Value : la valeur du champ cl donn utilis pour extraire les donnes correspondantes. Limit Advanced settings tStatCatcher Statistics Utilisation Limitation n/a Saisissez un chiffre ou un nombre indiquant le maximum de lignes de donnes extraire. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Gnralement utilis comme composant de dbut. Un composant de sortie est ncessaire.

Scnario : Utiliser les cls des requtes pour extraire des donnes dun systme Sage X3 donn
Ce scnario dcrit un Job deux composants utilis pour extraire une ligne ou des donnes dun systme Sage X3 donn. La mthode des objets est appele, les lments variables de cet objet sont des attributs. Les donnes utilises dans ce scnario proviennent de lexemple fourni par Sage X3.

Dposez un composant tSageX3Input et un tLogRow de la Palette dans lespace de modlisation graphique. Reliez le composant tSageX3Input au tLogRow laide dun lien Row > Main. Double-cliquez sur le tSageX3Input afin de configurer ses Basic Settings dans la vue Component.

Guide de Rfrence des Composants Talend Open Studio

63

Scnario : Utiliser les cls des requtes pour extraire des donnes dun systme Sage X3 donn

Dans la liste Schema, slectionnez Built-In. Cliquez sur le bouton [...] ct du champ Edit schema pour ouvrir lditeur du schma.

Dans cet diteur, cliquez douze fois sur le bouton [+] pour ajouter 12 lignes la table.

64

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser les cls des requtes pour extraire des donnes dun systme Sage X3 donn

Saisissez les noms que vous souhaitez utiliser pour chaque ligne. Dans cet exemple, ces lignes sont nommes daprs les noms de publication des attributs des objets dfinis dans le serveur Web Sage X3. Ces colonnes sont utilises pour mapper les champs des attributs correspondants dans le systme Sage X3. Dans la colonne Type, cliquez sur la ligne IMG pour afficher une liste droulante. Dans la liste droulante, slectionnez List, puisque lattribut apparat plusieurs fois dans Sage. Rptez lopration pour changer le type des lignes TIT2NBLIG, ITMLNK et ZITMLNK en List pour la mme raison. Cliquez sur OK pour valider les modifications et acceptez la propagation propose par la bote de dialogue qui souvre. Dans le champ Endpoint address, saisissez lURL du service Web fournie par le serveur Web Sage X3. Dans cet exemple, lURL est : http://10.42.20.168:28880/adxwsvc/services/CAdxWebServiceXmlCC. Dans le champ User, saisissez le nom de lutilisateur de Sage X3. Dans cet exemple, lutilisateur est ERP. Dans le champ Language, saisissez le nom du code langue X3 utilis pour le dmarrage dun groupe de connexions, FRA dans cet exemple. Dans le champ Pool alias, saisissez le nom du pool de connexion utiliser. Dans cet exemple, le pool de connexion est appel TALEND. Dans le champ Publication name, saisissez le nom de publication de lobjet appeler. Dans ce scnario, le nom de publication est ITMDET. Dans les colonnes Group ID et Field name de la table Mapping, saisissez les valeurs correspondant lID du groupe dattributs et au nom de publication dfinis dans le serveur Web Sage X3. Dans cet exemple, les valeurs sont prsentes comme suit :

Dans la table Mapping, la colonne Column a t automatiquement renseigne avec les colonnes que vous avez cres dans lditeur du schma. Cochez la case Query condition pour activer le tableau Conditions. Sous le tableau Conditions, cliquez sur le bouton [+] pour ajouter une ligne. Dans la colonne Key, saisissez le nom de publication associ lattribut de lobjet dont vous souhaitez extraire les donnes. Dans la colonne Value, saisissez la valeur de lattribut que vous avez slectionn comme cl de lextraction. Dans ce scnario, sa valeur est CONTS00059, une des rfrences produit. Slectionnez Built-In dans la liste Schema puis cliquez sur [...] ct du champ Edit schema afin douvrir lditeur du schma.

Guide de Rfrence des Composants Talend Open Studio

65

Scnario : Utiliser les cls des requtes pour extraire des donnes dun systme Sage X3 donn

Appuyez sur F6 pour excuter le Job. Les rsultats sont affichs dans la vue Run :

66

Guide de Rfrence des Composants Talend Open Studio

tSageX3Output

tSageX3Output

Proprits du tSageX3Output
Famille de com- Business/Sage posant X3 Fonction Le composant tSageX3Output se connecte au service Web fourni par un serveur Web Sage X3 donn et partir de l, insre, met jour ou supprime des donnes dans le systme Sage X3 (serveur X3). Ce composant crit des donnes dans un systme Sage X3 donn. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Si vous effectuez des modifications, le schma passera automatiquement en built-in. Endpoint dress Username Password Language Pool alias ad- Saisissez ladresse du Service Web fourni par le serveur Web Sage X3 donn. et Saisissez les informations dauthentification pour le Service Web, dfinies lors de la configuration du Serveur Web Sage X3. Saisissez le nom du code langue X3 utilis pour le dmarrage du groupe de connexions. Saisissez le nom du pool de connexion distribuant les requtes reues aux connexions disponibles. Ce nom est donn depuis la console de configuration Sage X3.

Objectif Basic settings

Request config Saisissez la chane de caractres de configuration si vous souhaitez rcuprer les informations de dbogage ou de traces. Par exemple, la chane de caractres peut tre : RequestConfigDebug=adxwss.trace.on=on; Si vous devez utiliser plusieurs chanes de caractres, sparez-les avec un &, par exemple,

RequestConfigDebug=adxwss.trace.on=on&adxwss.trace.size=163 Un outil tiers est ncessaire pour rcuprer ce type dinformations. Publication name Saisissez dans ce champ le nom de lobjet, de la liste ou du sous-programme publi(e) auquel/ laquelle vous souhaitez que votre Studio accde.

Guide de Rfrence des Composants Talend Open Studio

67

Scnario : Utiliser un service Web Sage X3 pour insrer des donnes dans un systme Sage X3 donn

Action

Vous pouvez effectuer lune des oprations suivantes sur les donnes dun systme Sage X3: Insert : insrer des donnes, Update : mettre jour des donnes, Delete : supprimer des donnes.

Mapping

Remplissez ce tableau pour mapper les lments variables de lobjet, le sous-programme ou la liste dfini(e)(s) dans le serveur Web Sage X3 donn au(x)quel(s)/ laquelle votre Studio accde. Seuls les lments sur lesquels vous souhaitez effectuer laction sont slectionns et saisis dans le but de raliser le mapping. Les colonnes complter incluent : Column : les colonnes dfinies dans lditeur du schma de ce composant. Key : llment variable utilis comme cl de linsertion, de la mise jour ou de la suppression de donnes. Cochez la case correspondante si la cl est un lment variable. Group ID : lidentifiant de chaque groupe dlments variables. Par exemple, un groupe dlments variables peut reprsenter lun des attributs dun objet. Field name : le nom du champ de chaque lment variable slectionn.

Advanced tings Utilisation Limitation

set- tStatCatcher Statistics

Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme composant de sortie et requiert un composant dentre. n/a

Scnario : Utiliser un service Web Sage X3 pour insrer des donnes dans un systme Sage X3 donn
Ce scnario dcrit un Job deux composants, utilis pour gnrer une ligne de donnes et insrer ces donnes dans un systme Sage X3 donn. Vous pouvez trouver les donnes utilises dans ce scnario dans lexemple fourni par Sage X3. Le service Web Sage X3 est utilis pour accder un objet.

Dposez un composant tFixedFlowInput et un tSageX3Output de la Palette dans lespace de modlisation graphique. Reliez le composant tFixedFlowInput au composant tSageX3Output laide dun lien Row > Main. Double-cliquez sur le tFixedFlowInput afin dafficher sa vue Component et dfinir ses proprits.

68

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser un service Web Sage X3 pour insrer des donnes dans un systme Sage X3 donn

Cliquez sur le bouton [...] ct du champ Edit schema afin douvrir lditeur du schma.

Cliquez quatre fois sur le bouton [+] afin dajouter quatre lignes au schma. Cliquez sur OK pour valider les modifications, puis acceptez la propagation propose par la bote de dialogue qui souvre ensuite. Les quatre lignes apparaissent automatiquement dans la table Values de la vue Component. Dans le tableau Values de la zone Mode, saisissez les valeurs de chacune des quatre lignes de la colonne Value. Dans ce scnario, les valeurs (de haut en bas) sont : CONTS00059, Screen 24\" standard 16/10, Screen 24\" standard 28/10 et 2. Les valeurs dans la colonne Value doivent tre mises entre guillemets. Double-cliquez sur le composant tSageX3Output afin dafficher sa vue Component et dfinir ses proprits.

Guide de Rfrence des Composants Talend Open Studio

69

Scnario : Utiliser un service Web Sage X3 pour insrer des donnes dans un systme Sage X3 donn

Dans le champ Endpoint address, saisissez lURL du service Web fourni par le serveur Web Sage X3. Dans cet exemple, lURL est : http://10.42.20.168:28880/adxwsvc/services/CAdxWebServiceXmlCC. Dans le champ User, saisissez le nom de lutilisateur de Sage X3. Dans cet exemple, lutilisateur est ERP. Dans le champ Language, saisissez le nom du code langue X3 utilis pour dmarrer un groupe de connexions. Dans cet exemple, le code est FRA. Dans le champ Pool alias, saisissez le nom du pool de connexion utiliser. Dans cet exemple, le pool de connexion est appel TALEND. Dans le champ Publication name, saisissez le nom de publication de lobjet appeler. Dans ce scnario, le nom de publication est ITMDET. Dans le champ Action, slectionnez insert dans la liste droulante. Dans la colonne Field name de la table Mapping, saisissez le nom des champs des attributs sur lesquels effectuer laction slectionne. Dans la colonne Group ID de la table Mapping, saisissez les valeurs correspondantes afin de regrouper les IDs des attributs slectionns. Ces IDs sont dfinis dans le serveur Web Sage X3.

Dans la table Mapping, la colonne Column a t automatiquement renseigne avec toutes les colonnes rcupres du schma du composant prcdent. Appuyez sur F6 pour excuter le Job.

70

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser un service Web Sage X3 pour insrer des donnes dans un systme Sage X3 donn

Pour vrifier les donnes que vous avez insres dans ce scnario, vous pouvez utiliser le composant tSageX3Input pour lire les donnes concernes dans le serveur Sage X3. Pour plus dinformations concernant lutilisation du composant tSageX3Input pour lire des donnes, consultez le composant tSageX3Input.

Guide de Rfrence des Composants Talend Open Studio

71

tSalesforceBulkExec

tSalesforceBulkExec

Les composants tSalesforceOutputBulk et tSalesforceBulkExec sont gnralement utiliss ensemble pour gnrer en sortie le fichier dfini et excuter ensuite les actions souhaites sur votre fichier, dans votre Salesforce.com. Cette excution en deux tapes est unifie dans le composant tSalesforceOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes.

Proprits du tSalesforceBulkExec
Famille de composant Fonction Objectif Business/Cloud Le composant tSalesforceBulkExec excute les actions dfinies sur les donnes de chargement de masse prpares. En tant que composant ddi, le tSalesforceBulkExec vous permet doptimiser les performances lors des excutions doprations dfinies dans votre Salesforce.com. Use an existing connec- Cochez cette case pour utiliser une connexion tablie tion partir du tSalesforceConnection. Une fois coche, la liste Component List apparat, et vous permet de slectionner le composant tSalesforceConnection devant tre utilis. Pour plus dinformations, consultez le composant tSalesforceConnection. Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide Utilisateur de votre Studio. Salesforce Webservice Saisissez lURL du service Web permettant de se URL connecter la base de donnes Salesforce. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Salesforce Version Bulk file path Action Saisissez la version de Salesforce que vous utilisez. Rpertoire o sont stockes les donnes de masse que vous devez traiter. Vous pouvez effectuer les oprations suivantes sur les donnes de lobjet Salesforce : Insert : insrer des donnes.

Basic settings

72

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Update : mettre jour des donnes. Upsert : mettre jour et insrer des donnes. Module Slectionnez lobjet adquat dans la liste. Custom Object : cette option fait apparatre le champ Costum Module Name dans lequel vous pouvez saisir lobjet auquel vous souhaitez vous connecter. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Advanced settings Rows to commit Bytes to commit Use Socks Proxy Saisissez le nombre de lignes devant tre traites par lot de donnes. Saisissez le nombre doctets par lot de donnes devant tre traits. Cochez cette case si vous souhaitez utiliser un proxy. Une fois la case coche, vous devez saisir les paramtres de connexion dans les champs qui apparaissent, lhte, le port, le nom dutilisateur et le mot de passe du proxy que vous souhaitez utiliser. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. Les donnes de masse traiter doivent tre au format .csv.

Scnario associ
Pour un scnario associ, consultez le composant tSalesforceOutputBulk.

Guide de Rfrence des Composants Talend Open Studio

73

tSalesforceConnection

tSalesforceConnection

Proprits du tSalesforceConnection
Famille de composant Fonction Objectif Basic settings Business/Cloud Le composant tSalesforceConnection ouvre une connexion vers un systme Salesforce afin deffectuer une transaction. Ce composant permet de vous connecter Salesforce. Salesforce Webservice Saisissez lURL du service Web permettant de se URL connecter la base de donnes Salesforce. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Timeout (milliseconds) Saisissez le dlai avant suspension de la requte sur Salesforce.com. For salesforce component bulk Cochez cette case si vous souhaitez utiliser des composants de traitement de donnes de masse de la famille Salesforce. Une fois la case coche, le champ Salesforce Version apparat dans lequel vous pouvez saisir la version de Salesforce que vous utilisez. Pour plus dinformations concernant ces composants de traitement de donnes de masse, consultez les composants tSalesforceBulkExec, tSalesforceOutputBulk et tSalesforceOutputBulkExec. Use Soap Compression Cochez cette case pour activer la compression SOAP. La compression des messages SOAP permet un gain de performance. Use Socks Proxy Cochez cette case si vous souhaitez utiliser un proxy. Une fois la case coche, vous devez saisir les paramtres de connexion dans les champs qui apparaissent, lhte, le port, le nom dutilisateur et le mot de passe du proxy que vous souhaitez utiliser. Dfinissez l'ID de l'utilisateur rel afin de diffrencier ceux qui utilisent le mme compte et le mme mot de passe pour accder au site Web Salesforce. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Client ID

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec les composants Salesforce. n/a

Scnario associ
Pour plus dinformations relatives au fonctionnement du composant tSalesforceConnection, consultez le composant tMysqlConnection.

74

Guide de Rfrence des Composants Talend Open Studio

tSalesforceGetDeleted

tSalesforceGetDeleted

Proprits du tSalesforceGetDeleted
Famille de composant Fonction Objectif Basic settings Business/Cloud Le composant tSalesforceGetDeleted rcupre les donnes supprimes dun objet Salesforce sur une priode donne. Ce composant rcupre les donnes supprimes de lobjet Salesforce spcifi sur une priode spcifie. Use an existing connec- Cochez cette case pour utiliser une connexion tablie tion partir du tSalesforceConnection. Une fois coche, la liste Component List apparat, et vous permet de slectionner le composant tSalesforceConnection devant tre utilis. Pour plus dinformations, consultez le composant tSalesforceConnection. Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide Utilisateur de votre Studio. Salesforce Webservice Saisissez lURL du service Web permettant de se URL connecter la base de donnes Salesforce. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Timeout (milliseconds) Saisissez le dlai avant suspension de la requte sur Salesforce.com. Module Slectionnez lobjet adquat dans la liste. Custom Object : cette option fait apparatre le champ Costum Module Name dans lequel vous pouvez saisir lobjet auquel vous souhaitez vous connecter. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository.

Guide de Rfrence des Composants Talend Open Studio

75

Scnario : Rcuprer les donnes supprimes du serveur Salesforce

Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Start Date Saisissez entre guillemet la date laquelle vous voulez commencer la recherche. Pour cela, utilisez le format de date suivant : yyy-MM-dd HH:mm:ss. Vous ne pouvez effectuer la recherche que sur les 30 derniers jours. End Date Saisissez entre guillemet la date laquelle vous voulez terminer la recherche. Pour cela, utilisez le format de date suivant : yyy-MM-dd HH:mm:ss.

Advanced settings

Use Soap Compression Cochez cette case pour activer la compression SOAP. La compression des messages SOAP permet un gain de performance. Client ID Dfinissez l'ID de l'utilisateur rel afin de diffrencier ceux qui utilisent le mme compte et le mme mot de passe pour accder au site Web Salesforce. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Scnario : Rcuprer les donnes supprimes du serveur Salesforce


Ce scnario dcrit un Job deux composants permettant de rcuprer les donnes supprimes du serveur Salesforce, dans les 5 derniers jours.

Cliquez et dposez les composants tSalesforceGetDeleted et tLogRow de la Palette dans le Job Designer. Reliez-les via un lien de type Row > Main. Double-cliquez sur le composant tSalesforceGetDeleted pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

76

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer les donnes supprimes du serveur Salesforce

Dans le champ Salesforce WebService URL, laissez lURL du service Web Salesforce par dfaut ou saisissez lURL laquelle vous souhaitez accder. Dans les champs Username et Password, saisissez votre identifiant et votre mot de passe de connexion au service Web. Dans la liste Module, slectionnez lobjet auquel vous souhaitez accder. Dans ce scnario, lobjectif est daccder lobjet Account. Dans la liste Schema, slectionnez Repository puis cliquez sur le bouton [...] pour slectionner le schma du repository que vous souhaitez utiliser pour le composant. Si vous navez pas enregistr le schma dans les mtadonnes du repository, slectionnez Built-in dans la liste Schema et cliquez sur le bouton [...] cot du champ Edit schema et paramtrer le schma manuellement. Dans les champs Start Date et End Date, saisissez la date de dbut et de fin de recherche des donnes supprimes en utilisant le format de date suivant : yyyy-MM-dd HH:mm:ss. Vous ne pouvez effectuer la recherche que sur les 30 derniers jours. Dans ce scnario, lobjectif est de chercher les donnes supprimes dans les cinq derniers jours. Double-cliquez sur le composant tLogRow pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits : Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Dans la zone Mode, slectionnez loption Vertical pour faire apparatre le rsultat dans sous forme de tableau dans la console. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

77

Scnario : Rcuprer les donnes supprimes du serveur Salesforce

La console affiche les donnes supprimes rcupres par le composant tSalesforceGetDeleted sous forme de tableau.

78

Guide de Rfrence des Composants Talend Open Studio

tSalesforceGetServerTimestamp

tSalesforceGetServerTimestamp

Proprits du tSalesforceGetServerTimestamp
Famille de composant Fonction Objectif Basic settings Business/Cloud Le composant tSalesforceGetServerTimestamp rcupre la date actuelle du serveur Salesforce. Ce composant rcupre la date actuelle sous forme de timestamp du serveur Salesforce. Use an existing connec- Cochez cette case pour utiliser une connexion tablie tion partir du tSalesforceConnection. Une fois coche, la liste Component List apparat, et vous permet de slectionner le composant tSalesforceConnection devant tre utilis. Pour plus dinformations, consultez le composant tSalesforceConnection. Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide Utilisateur de votre Studio. Salesforce Webservice Saisissez lURL du service Web permettant de se URL connecter la base de donnes Salesforce. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Timeout (milliseconds) Saisissez le dlai avant suspension de la requte sur Salesforce.com. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent.

Guide de Rfrence des Composants Talend Open Studio

79

Scnario associ

Advanced settings

Use Socks Proxy

Cochez cette case si vous souhaitez utiliser un proxy. Une fois la case coche, vous devez saisir les paramtres de connexion dans les champs qui apparaissent, lhte, le port, le nom dutilisateur et le mot de passe du proxy que vous souhaitez utiliser.

Use Soap Compression Cochez cette case pour activer la compression SOAP. La compression des messages SOAP permet un gain de performance. Client ID Dfinissez l'ID de l'utilisateur rel afin de diffrencier ceux qui utilisent le mme compte et le mme mot de passe pour accder au site Web Salesforce. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Scnario associ
Aucun scnario nest disponible pour ce composant.

80

Guide de Rfrence des Composants Talend Open Studio

tSalesforceGetUpdated

tSalesforceGetUpdated

Proprits du tSalesforceGetUpdated
Famille de composant Fonction Objectif Basic settings Business/Cloud Le composant tSalesforceGetUpdated rcupre les donnes mises jour dun objet Salesforce sur une priode donne. Ce composant rcupre les donnes mises jour de lobjet Salesforce spcifi sur une priode spcifie. Use an existing connec- Cochez cette case pour utiliser une connexion tablie tion partir du tSalesforceConnection. Une fois coche, la liste Component List apparat, et vous permet de slectionner le composant tSalesforceConnection devant tre utilis. Pour plus dinformations, consultez le composant tSalesforceConnection. Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide Utilisateur de votre Studio. Salesforce Webservice Saisissez lURL du service Web permettant de se URL connecter la base de donnes Salesforce. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Timeout (milliseconds) Saisissez le dlai avant suspension de la requte sur Salesforce.com. Module Slectionnez lobjet adquat dans la liste. Custom Object : cette option fait apparatre le champ Custom Module Name dans lequel vous pouvez saisir lobjet auquel vous souhaitez vous connecter. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository.

Guide de Rfrence des Composants Talend Open Studio

81

Scnario associ

Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Start Date Saisissez entre guillemet la date laquelle vous voulez commencer la recherche. Pour cela, utilisez le modle de date suivant : yyy-MM-dd HH:mm:ss. Vous ne pouvez effectuer la recherche que sur les 30 derniers jours. End Date Saisissez entre guillemets la date laquelle vous voulez terminer la recherche. Pour cela, utilisez le modle de date suivant : yyy-MM-dd HH:mm:ss.

Advanced settings

Use Soap Compression Cochez cette case pour activer la compression SOAP. La compression des messages SOAP permet un gain de performance. Client ID Dfinissez l'ID de l'utilisateur rel afin de diffrencier ceux qui utilisent le mme compte et le mme mot de passe pour accder au site Web Salesforce. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Scnario associ
Aucun scnario nest disponible pour ce composant.

82

Guide de Rfrence des Composants Talend Open Studio

tSalesforceInput

tSalesforceInput

Proprits du tSalesforceInput
Famille de Business/Cloud composant Fonction Objectif Basic settings Le composant tSalesforceInput se connecte un objet de la base de donnes Salesforce via le service Web adquat. Ce composant permet dextraire les donnes dune base de donnes Salesforce laide dune requte. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant connexion de base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connection Cochez cette case pour utiliser une connexion tablie partir du tSalesforceConnection. Une fois coche, la liste Component List apparat, et vous permet de slectionner le composant tSalesforceConnection devant tre utilis. Pour plus dinformations, consultez la section intitule Proprits du tSalesforceConnection . Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide Utilisateur de votre Studio. Salesforce Webservice URL Username et Password Timeout (milliseconds) Module Saisissez lURL du service Web permettant de se connecter la base de donnes Salesforce. Saisissez les informations dauthentification de lutilisateur au service Web. Saisissez le dlai avant suspension de la requte sur Salesforce.com. Slectionnez lobjet adquat dans la liste.

Guide de Rfrence des Composants Talend Open Studio

83

Proprits du tSalesforceInput

Use Custom Object : cette option fait apparatre le champ Costum Module Name dans lequel vous pouvez saisir lobjet auquel vous souhaitez vous connecter. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Pour retrouver une colonne dun module li, il est ncessaire de dfinir la colonne, dune manire prcise, dans la vue Edit Schema, sinon la requte relationnelle ne fonctionnera pas. La syntaxe correcte est : NameofCurrentModule_NameofLinked Module_NameofColumnofInterest. Query condition Saisissez la requte permettant de slectionner les donnes extraire. Exemple : account_name= Talend

Manual input of SOQL query Cochez cette case pour saisir manuellement la requte Salesforce que vous souhaitez effectuer dans le champ Query. Query all records (include Cochez cette case pour interroger tous les enregistrements, y deleted records) compris les enregistrements supprims. Advanced set- Batch Size tings Use Socks Proxy Nombre denregistrements dans chaque lot rcupr. Cochez cette case si vous souhaitez utiliser un proxy. Une fois la case coche, vous devez saisir les paramtres de connexion dans les champs qui apparaissent, lhte, le port, le nom dutilisateur et le mot de passe du proxy que vous souhaitez utiliser. (for Caractre, chane ou expression rgulire utilis pour normaliser les donnes collectes laide de requtes effectues sur les relations hirarchiques entre les diffrents objets Salesforce.

Normalize delimited child relationship)

Column name delimiter (for Caractre, chane ou expression rgulire utilis pour sparer le child relationship) nom de lobjet parent du nom de lobjet fils lorsque vous effectuez une requte sur les relations hirarchiques entre les diffrents objets Salesforce. Use Soap Compression Cochez cette case pour activer la compression SOAP. La compression des messages SOAP permet un gain de performance, notamment lors des oprations de batch. tStatCatcher Statistics Client ID Cochez cette case pour collecter les donnes de log au niveau du composant. Dfinissez l'ID de l'utilisateur rel afin de diffrencier ceux qui utilisent le mme compte et le mme mot de passe pour accder au site Web Salesforce.

Utilisation Limitation

Ce composant est gnralement utilis en tant que composant de dbut. Un composant de sortie est ncessaire. n/a

84

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser des requtes pour extraire des donnes dune base de donnes Salesforce

Scnario : Utiliser des requtes pour extraire des donnes dune base de donnes Salesforce
Ce scnario dcrit un Job comprenant quatre composants, utiliss pour extraire des ensembles spcifiques de donnes dobjets parents et enfants dans une base de donnes Salesforce. Dposez deux composants tSalesforceInput et deux tLogRow dans lespace de modlisation graphique.

Reliez chaque composant tSalesforceInput un tLogRow, laide de liens Row > Main. Reliez le tSalesforceInput_1 au tSalesforceInput_2 en utilisant un lien OnSubjobOk. Double-cliquez sur le tSalesforceInput_1 afin de dfinir ses Basic Settings dans la vue Component.

Dans la liste Property Type, slectionnez Built-In. Dans le champ Salesforce WebService URL, saisissez lURL de la base de donnes laquelle vous souhaitez vous connecter. Renseignez vos informations dauthentification dans les champs correspondants, Username pour lidentifiant et Password pour le mot de passe. Saisissez la limite de temps que vous souhaitez appliquer la requte, dans le champ Timeout (milliseconds). Slectionnez le Module (objet Salesforce) que vous souhaitez interroger. Cochez la case Manual input of SOQL Query afin de saisir votre requte dans le champ Query. Saisissez votre requte, ou votre requte relationnelle, en respectant la syntaxe SOQL requise.

Guide de Rfrence des Composants Talend Open Studio

85

Scnario : Utiliser des requtes pour extraire des donnes dune base de donnes Salesforce

Dans cet exemple, les colonnes IsWon et FiscalYear dans la requte sont situes dans le module Opportunity spcifi. La colonne Name est dans un module li, appel Account. Pour retourner une colonne dun module li, la syntaxe correcte est de saisir le nom du module li, suivi par le caractre point (.), puis par le nom de la colonne approprie. Ici, la requte requise est donc : SELECT IsWon, FiscalYear, Account.Name FROM Opportunity. Pour retrouver une colonne dun modle li, il est ncessaire de dfinir la colonne dune manire prcise dans la vue Edit Schema. La syntaxe correcte est : NameofCurrentModule_NameofLinkedModule_NameofColumnofInterest . Dans notre exemple, la colonne doit se nommer : Opportunity_Account_Name. Si cette syntaxe nest pas respecte, les donnes de la table lie ne seront pas retournes. Slectionnez Built-In dans la liste Schema puis cliquez sur le bouton [...] ct du champ Edit schema, afin douvrir lditeur du schma.

Modifiez le schma comme ncessaire, en utilisant les boutons [+] et [x]. Ajoutez une nouvelle colonne pour les champs extraits de la colonne Name du module Account. Appelez cette colonne Opportunity_Account_Name. Cliquez sur OK afin de sauvegarder les modifications et fermer lditeur du schma. Double-cliquez sur le tSalesforceInput_2 afin de dfinir ses Basic settings dans la vue Component.

Dans la liste Property Type, slectionnez Built-In.

86

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser des requtes pour extraire des donnes dune base de donnes Salesforce

Dans le champ Salesforce WebService URL, saisissez lURL de la base de donnes laquelle vous souhaitez vous connecter. Saisissez vos informations dauthentification dans les champs Username pour lidentifiant et Password pour le mot de passe. Saisissez la limite de temps que vous souhaitez appliquer sur la requte, dans le champ Timeout (milliseconds). Slectionnez le Module (objet Salesforce) que vous souhaitez interroger. Cochez la case Manual input of SOQL Query pour saisir votre requte dans le champ Query. Saisissez votre requte ou votre requte relationnelle, en respectant la syntaxe SOQL requise. Dans cet exemple, lobjectif est dextraire les champs Id et CaseNumber du module Case, ainsi que les champs Name du module Account. La requte est donc : SELECT Id, CaseNumber, Account.Name FROM Case. Slectionnez Built-In dans la liste Schema et cliquez sur le bouton [...] ct du champ Edit schema, afin douvrir lditeur du schma.

Modifiez le schma comme ncessaire, en utilisant les boutons [+] et [x]. Ajouter une nouvelle colonne pour les champs extraits de la colonne Name du module Account. Nommez cette colonne Case_Account_Name. Cliquez sur OK pour sauvegarder les modifications et fermer lditeur du schma. Cliquez sur chaque composant tLogRow afin de dfinir leurs Basic settings comme ncessaire. Dans cet exemple, vous navez pas besoin de modifier les paramtres des tLogRow. Appuyez sur F6 pour excuter le Job. Les rsultats sont affichs dans la console de la vue Run :

Guide de Rfrence des Composants Talend Open Studio

87

Scnario : Utiliser des requtes pour extraire des donnes dune base de donnes Salesforce

88

Guide de Rfrence des Composants Talend Open Studio

tSalesforceOutput

tSalesforceOutput

Proprits du tSalesforceOutput
Famille de composant Fonction Objectif Basic settings Business/Cloud Le composant tSalesforceOutput crit dans un objet de la base de donnes Salesforce via le service Web adquat. Ce composant permet dcrire des donnes dans une base de donnes Salesforce. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant connexion de base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case pour utiliser une connexion tablie tion partir du tSalesforceConnection. Une fois coche, la liste Component List apparat, et vous permet de slectionner le composant tSalesforceConnection devant tre utilis. Pour plus dinformations, consultez la section intitule Proprits du tSalesforceConnection . Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide utilisateur de votre Studio. Salesforce Webservice Saisissez lURL du service Web permettant de se URL connecter la base de donnes Salesforce. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web.

Guide de Rfrence des Composants Talend Open Studio

89

Proprits du tSalesforceOutput

Timeout (milliseconds) Saisissez le dlai avant suspension de la requte sur Salesforce.com. Action Vous pouvez effectuer lune des oprations suivantes sur les donnes de lobjet Salesforce : Insert : insrer les donnes. Update : mettre les donnes jour. Delete : supprimer les donnes. Upsert : mettre jour et insrer les donnes. Module Slectionnez lobjet adquat dans la liste. Custom Object : cette option fait apparatre le champ Costum Module Name dans lequel vous pouvez saisir lobjet auquel vous souhaitez vous connecter. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Advanced settings Extended Output Cette case est coche par dfaut. Elle permet de transfrer les donnes de sortie en lot. Dans le champ Rows to commit, spcifiez le nombre de lignes par lot. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject. Renseignez ce champ si vous souhaitez crer un fichier contenant les logs derreur. Pour cela, cliquez sur le bouton [...] cot de ce champ pour dfinir le chemin daccs et le nom du fichier Cochez cette case si vous souhaitez utiliser un proxy. Une fois la case coche, vous devez saisir les paramtres de connexion dans les champs qui apparaissent, lhte, le port, le nom dutilisateur et le mot de passe du proxy que vous souhaitez utiliser.

Die on error

Error logging file

Use Socks Proxy

Use Soap Compression Cochez cette case pour activer la compression SOAP. La compression des messages SOAP permet un gain de performance. Retrieve inserted ID Cochez cette case afin de permettre Salesforce.com de retourner lID Salesforce produit pour une nouvelle ligne devant tre insre. La colonne ID est ajoute au schma des donnes traites dans Salesforce.com.

90

Guide de Rfrence des Composants Talend Open Studio

Scnario : Supprimer des donnes de lobjet Account

Cette option est disponible uniquement si vous avez slectionn laction Insert, mais non en mode batch, cest--dire sans loption Extended Output. tStatCatcher Statistics Client ID Cochez cette case pour collecter les donnes de log au niveau du composant. Dfinissez l'ID de l'utilisateur rel afin de diffrencier ceux qui utilisent le mme compte et le mme mot de passe pour accder au site Web Salesforce.

Utilisation Limitation

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Scnario : Supprimer des donnes de lobjet Account


Ce scnario dcrit un Job deux composants permettant de supprimer une entre de lobjet Account.

Cliquez et dposez les composants tSalesforceInput et tSalesforceOutput de la Palette dans le Job Designer. Reliez-les via un lien de type Row > Main. Double-cliquez sur le composant tSalesforceInput pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Dans la liste Property Type, slectionnez Repository si vous avez stock la connexion au serveur Salesforce dans les mtadonnes du Repository. Les autres champs seront renseigns automatiquement. Si vous navez pas stock la connexion dans les mtadonnes, slectionnez Built-in dans la liste et renseignez les champs manuellement. Pour plus dinformations concernant la cration de mtadonnes Salesforce, consultez le Guide utilisateur de Talend Open Studio. Dans le champ Salesforce WebService URL, laissez lURL du service Web Salesforce par dfaut ou saisissez lURL laquelle vous souhaitez accder.

Guide de Rfrence des Composants Talend Open Studio

91

Scnario : Supprimer des donnes de lobjet Account

Dans les champs Username et Password, saisissez votre identifiant et votre mot de passe de connexion au service Web. Dans la liste Module, slectionnez lobjet auquel vous souhaitez accder. Dans ce scnario, lobjectif est daccder lobjet Account. Dans la liste Schema, slectionnez Repository puis cliquez sur le bouton [...] pour slectionner le schma du repository que vous souhaitez utiliser pour le composant. Si vous navez pas enregistr le schma dans les mtadonnes du repository, slectionnez Built-in dans la liste Schema et cliquez sur le bouton [...] cot du champ Edit schema et paramtrer le schma manuellement. Dans le champ Query Condition, saisissez la requte que vous souhaitez appliquer. Pour ce scnario, lobjectif est de rcuprer le ou les clients dont le nom est sForce., ainsi, saisissez la requte : name=sForce. Pour une requte plus avance, cochez la case Manual input of SOQL query et saisissez-la manuellement. Double-cliquez sur le composant tSalesforceOutput pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Dans le champ Salesforce WebService URL, laissez lURL du service Web Salesforce par dfaut ou saisissez lURL laquelle vous souhaitez accder. Dans les champs Username et Password, saisissez votre identifiant et votre mot de passe de connexion au service Web. Dans la liste Action, slectionnez laction que vous souhaitez effectuer. Ici, slectionnez Delete pour supprimer le compte sForce slectionn dans le composant prcdent. Dans la liste Module, slectionnez lobjet auquel vous souhaitez accder. Dans ce scnario, lobjectif est daccder lobjet Account. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Enregistrez le Job et appuyez sur F6 pour lexcuter. Consultez le contenu de lobjet Account et vrifiez que le compte sForce a t supprim du serveur.

92

Guide de Rfrence des Composants Talend Open Studio

tSalesforceOutputBulk

tSalesforceOutputBulk

Les composants tSalesforceOutputBulk et tSalesforceBulkExec sont gnralement utiliss ensemble pour gnrer en sortie le fichier dfini et excuter ensuite les actions souhaites sur votre fichier, dans votre Salesforce.com. Cette excution en deux tapes est unifie dans le composant tSalesforceOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes.

Proprits du tSalesforceOutputBulk
Famille de composant Fonction Objectif Basic settings Business/Cloud Le composant tSalesforceOutputBulk gnre des fichiers dans un format appropri au traitement de masse. Ce composant prpare le fichier devant tre trait par le tSalesForceBulkExec afin dexcuter des actions sur Salesforce.com. File Name Append Parcourez le rpertoire o stocker les fichiers gnrs. Cochez cette case afin dcrire la suite des donnes existantes. Sinon, les donnes seront crases.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis avec le tSalesforceBulkExec. Ils permettent doptimiser les performances dalimentation ou de modification des informations sur Salesforce.com. n/a

Limitation

Scnario : Insrer des donnes de masse transformes dans votre Salesforce.com


Ce scnario dcrit un Job six composants qui transforme des donnes .csv appropries un traitement de masse, les charge dans Salesforce.com et affiche ensuite les rsultats de lexcution du Job dans la console.

Guide de Rfrence des Composants Talend Open Studio

93

Scnario : Insrer des donnes de masse transformes dans votre Salesforce.com

Ce Job est ralis en deux tapes : prparer les donnes en les transformant, puis traiter les donnes transformes. Avant de commencer ce scnario, vous devez prparer le fichier original comprenant les donnes devant tre traites par le Job. Dans cet exemple dutilisation, le fichier est sforcebulk.txt, il contient des informations relatives aux clients. Afin de crer et excuter ce Job, procdez comme suit : Glissez-dposez de la Palette dans lespace de modlisation graphique les composants tFileInputDelimited, tMap, tSalesforceOutputBulk, tSalesforceBulkExec et deux tLogRow. Utilisez un lien Row > Main afin de connecter le tFileInputDelimited au tMap, et le lien Row > out1 du tMap au tSalesforceOutputBulk. Utilisez un lien Row > Main et un lien Row > Reject pour connecter le tSalesforceBulkExec aux deux tLogRow respectivement. Utilisez un lien Trigger > OnSubjobOk afin de connecter le composant tFileInputDelimited au tSalesforceBulkExec. Double-cliquez sur le tFileInputDelimited afin dafficher sa vue Component et dfinir ses proprits.

Dans la liste Property Type, slectionnez Repository si vous avez dj stock votre connexion Salesforce sous le nud Metadata dans la vue Repository. Les proprits sont automatiquement remplies. Si vous navez pas

94

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes de masse transformes dans votre Salesforce.com

dfini le serveur de connexion localement dans le Repository, renseignez les informations manuellement, aprs avoir slectionn Built-in dans la liste Property Type. Pour plus dinformations concernant la cration des mtadonnes de fichier dlimit, consultez le Guide utilisateur de Talend Open Studio. A ct du champ File name/Stream, cliquez sur le bouton fichier, dans cet exemple sforcebulk.txt. afin de parcourir votre rpertoire jusqu votre

Dans la liste Schema, slectionnez Repository, puis cliquez sur le bouton [...] afin douvrir la bote de dialogue dans laquelle vous pourrez slectionner le schma du Repository utiliser pour ce composant. Si vous navez pas dfini localement votre fichier dans les mtadonnes, slectionnez Built-in dans la liste Schema, puis cliquez sur le bouton [...] ct du champ Edit schema, afin douvrir une bote de dialogue dans laquelle vous pourrez dfinir le schma manuellement. Dans ce scnario, le schma se compose de quatre colonnes : Name, ParentId, Phone et Fax.

Selon votre fichier dentre, paramtrez les autres champs, comme Row Separator, Field Separator... Double-cliquez sur le composant tMap afin douvrir son diteur et dfinir la transformation. Glissez-dposez toutes les colonnes de la table dentre dans la table de sortie.

Ajoutez .toUpperCase() la fin de la colonne Name. Cliquez sur OK afin de valider la transformation. Double-cliquez sur le tSalesforceOutputBulk afin dafficher sa vue Component et dfinir ses proprits.

Dans le champ File Name, parcourez votre rpertoire jusqu lemplacement o vous souhaitez stocker les donnes .csv gnres pour un traitement de masse.

Guide de Rfrence des Composants Talend Open Studio

95

Scnario : Insrer des donnes de masse transformes dans votre Salesforce.com

Cliquez sur le bouton Sync columns afin dimporter le schma du composant prcdent. Double-cliquez sur le tSalesforceBulkExect afin dafficher sa vue Component et dfinir ses proprits.

Utilisez lURL par dfaut du service Web Salesforce, ou saisissez lURL laquelle vous souhaitez accder. Dans les champs Username et Password, saisissez votre identifiant et votre mot de passe de connexion au service Web. Dans le champ Bulk file path, parcourez votre rpertoire jusqu lemplacement o est stock le fichier .csv gnr par le tSalesforceOutputBulk. Dans la liste Action, slectionnez laction que vous voulez effectuer sur les donnes de masse. Dans cet exemple, slectionnez insert. Dans la liste Module, slectionnez llment auquel vous souhaitez accder, Account dans cet exemple. Dans la liste Schema, slectionnez Repository et cliquez sur le bouton [...] afin douvrir une bote de dialogue dans laquelle vous pourrez slectionner le schma du Repository utiliser pour ce composant. Si vous navez pas dfini votre schma localement dans les mtadonnes, slectionnez Built-in dans la liste Schema, puis cliquez sur le bouton [...] ct du champ Edit schema, afin douvrir une bote de dialogue dans laquelle vous pourrez dfinir votre schma manuellement. Dans cet exemple, dfinissez-le comme le schma prcdent. Double-cliquez sur le tLogRow_1 afin dafficher sa vue Component et dfinir ses proprits.

Cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent. Slectionnez le mode Table afin dafficher les rsultats dexcution dans un tableau. Rptez lopration avec le tLogRow_2. Sauvegardez votre Job, et appuyez sur F6 pour lexcuter. Dans la console de la vue Run, vous pouvez vrifier les rsultats dexcution.

96

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes de masse transformes dans votre Salesforce.com

Dans le tableau du tLogRow_1, vous pouvez lire les donnes insres dans votre Salesforce.com. Dans le tableau du tLogRow_2, vous pouvez lire les donnes rejetes cause dune incompatibilit avec les lments Account auxquels vous avez accd. Tous les noms de clients sont crits en majuscules.

Guide de Rfrence des Composants Talend Open Studio

97

tSalesforceOutputBulkExec

tSalesforceOutputBulkExec

Les composants tSalesforceOutputBulk et tSalesforceBulkExec sont gnralement utiliss ensemble pour gnrer en sortie le fichier dfini et excuter ensuite les actions souhaites sur votre fichier, dans votre Salesforce.com. Cette excution en deux tapes est unifie dans le composant tSalesforceOutputBulkExec. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes.

Proprits du tSalesforceOutputBulkExec
Famille de composant Fonction Objectif Business/Cloud Le composant tSalesforceOutputBulkExec excute les actions dfinies sur les donnes .csv pour Salesforce.com. En tant que composant ddi, le tSalesforceOutpuBulkExec permet doptimiser les performances lors des oprations dfinies sur les donnes, dans votre Salesforce.com. Use an existing connec- Cochez cette case pour utiliser une connexion tablie tion partir du tSalesforceConnection. Une fois coche, la liste Component List apparat, et vous permet de slectionner le composant tSalesforceConnection devant tre utilis. Pour plus dinformations, consultez la section intitule Proprits du tSalesforceConnection . Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide utilisateur de votre Studio. Salesforce Webservice Saisissez lURL du service Web permettant de se URL connecter la base de donnes Salesforce. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Salesforce Version Bulk file path Action Saisissez la version de Salesforce que vous utilisez. Chemin daccs au rpertoire o sont stockes les donnes de masse traiter. Vous pouvez effectuer lune des oprations suivantes sur les donnes de lobjet Salesforce : Insert : insrer les donnes.

Basic settings

98

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes de masse dans votre Salesforce.com

Update : mettre les donnes jour. Upsert : mettre jour et insrer les donnes. Module Slectionnez lobjet adquat dans la liste. Custom Object : cette option fait apparatre le champ Custom Module Name dans lequel vous pouvez saisir lobjet auquel vous souhaitez vous connecter. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Advanced settings Rows to commit Bytes to commit Use Socks Proxy Saisissez le nombre de lignes devant tre traites par lot de donnes. Saisissez le nombre doctets par lot de donnes devant tre traits. Cochez cette case si vous souhaitez utiliser un proxy. Dans ce cas, vous devez renseigner les paramtres du proxy dans les champs qui apparaissent, une fois la case coche. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. Les donnes de masse traiter dans Salesforce.com doivent tre au format .csv

Scnario : Insrer des donnes de masse dans votre Salesforce.com


Ce scnario dcrit un Job quatre composants qui charge des donnes en masse dans Salesforce.com, excute les actions dfinies, et affiche les rsultats dexcution du Job dans la console.

Guide de Rfrence des Composants Talend Open Studio

99

Scnario : Insrer des donnes de masse dans votre Salesforce.com

Avant de raliser ce Job, vous devez prparer votre fichier dentre, contenant les donnes devant tre traites par le Job. Dans cet exemple, le fichier sforcebulk.txt, contient des informations relatives aux clients. Afin de crer et excuter le Job, procdez comme suit : Glissez-dposez de la Palette dans lespace de modlisation graphique un composant tFileInputDelimited, un tSalesforceOutputBulkExec, et deux tLogRow. Utilisez un lien Row > Main pour connecter le tFileInputDelimited au tSalesforceOutputBulkExec. Utilisez un lien Row > Main et un lien Row > Reject afin de connecter le tSalesforceOutputBulkExec aux deux tLogRow respectifs. Double-cliquez sur le tFileInputDelimited afin dafficher sa vue Component et dfinir ses proprits.

Dans la liste Property Type, slectionnez Repository si vous avez dj stock votre connexion au serveur Salesforce dans le nud Metadata de la vue Repository. Les proprits sont automatiquement renseignes. Si vous navez pas dfini la connexion au serveur localement dans le Repository, remplissez les champs manuellement, aprs avoir slectionn Built-in dans la liste Property Type. Pour plus dinformations concernant la cration des mtadonnes de fichier dlimit, consultez le Guide utilisateur de Talend Open Studio. A ct du champ File name/Stream, cliquez sur le bouton exemple sforcebulk.txt. afin de slectionner votre fichier dentre, par

Dans la liste Schema, slectionnez Repository, puis cliquez sur le bouton [...] pour ouvrir une bote de dialogue dans laquelle vous pourrez slectionner le schma utiliser pour ce composant. Si vous navez pas dfini votre schma localement dans les mtadonnes, slectionnez Built-in dans la liste Schema, puis cliquez sur le bouton [...] ct du champ Edit schema, afin douvrir une bote de dialogue o vous pourrez dfinir le schma manuellement. dans ce scnario, le schma se compose de quatre colonnes : Name, ParentId, Phone et Fax.

Configurez les autres proprits selon votre fichier dentre, comme Row Separator, Field Separator... Double-cliquez sur le composant tSalesforceOutputBulkExec afin dafficher sa vue Component et dfinir ses proprits.

100

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes de masse dans votre Salesforce.com

Dans le champ Salesforce WebService URL, utilisez lURL par dfaut du service Web Salesforce, ou saisissez lURL laquelle vous souhaitez accder. Dans les champs Username et Password, saisissez votre identifiant et votre mot de passe de connexion au service Web. Dans le champ Bulk file path, parcourez votre rpertoire jusqu lemplacement o vous stockez les donnes .csv devant tre traites. Le fichier de masse traiter doit tre au format .csv. Dans la liste Action, slectionnez laction effectuer sur les donnes de masse, insert dans cet exemple. Dans la liste Module, slectionnez llement auquel vous souhaitez accder, Account dans cet exemple. Dans la liste Schema, slectionnez Repository, puis cliquez sur le bouton [...] afin douvrir une bote de dialogue dans laquelle vous pourrez slectionner le schma du Repository utiliser pour ce composant. Si vous navez pas dfini votre schma localement dans les mtadonnes, slectionnez Built-in dans la liste Schema, puis cliquez sur le bouton [...] ct du champ Edit schema afin douvrir une bote de dialogue o vous pourrez dfinir manuellement le schma. Dans cet exemple, dfinissez le schma comme prcdemment. Double-cliquez sur le tLogRow_1 afin dafficher sa vue Component et dfinir ses proprits.

Cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent. Slectionnez le mode Table afin dafficher les rsultats dexcution dans un tableau. Rptez lopration pour le tLogRow_2. Sauvegardez votre Job et appuyez sur F6 afin de lexcuter. Dans la console de la vue Run, vous pouvez vrifier les rsultats dexcution.

Guide de Rfrence des Composants Talend Open Studio

101

Scnario : Insrer des donnes de masse dans votre Salesforce.com

Dans le tableau du tLogRow_1, vous pouvez lire les donnes insres dans Salesforce.com. Dans le tableau du tLogRow_2, vous pouvez lire les donnes rejetes cause dune incompatibilit avec les lments Account auxquels vous avez accd. Si vous souhaitez transformer les donnes dentre avant de les charger, vous devez utiliser un tSalesforceOutputBulk et un tSalesforceBulkExec pour raliser le Job complet. Pour plus dinformations propos de lutilisation de ces deux composants, consultez la section intitule Scnario : Insrer des donnes de masse transformes dans votre Salesforce.com .

102

Guide de Rfrence des Composants Talend Open Studio

tSAPCommit

tSAPCommit

Proprits du tSAPCommit
Ce composant est troitement li aux composants tSAPConnection et tSAPRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Business/SAP Valide les donnes traites dans un Job, via un serveur connect. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. SAPConnection ponent list Com- Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tSAPConnection dans la liste. Cette case est slectionne par dfaut. Elle vous permet de fermer une connexion une base de donnes, une fois le commit effectu; Dcochez cette case afin de continuer utiliser la connexion slectionne, une fois que le composant a excut sa tche. Si vous utilisez un lien Row > Main pour relier le tSAPCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Release connection , ou votre connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Release Connection

Ce composant est gnralement utilis avec des composants SAP et notamment avec les composants tSAPConnection et tSAPRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tSAPConnection et tSAPRollback. Ils sont gnralement utiliss ensemble lors de transactions, avec un tSAPConnection permettant douvrir une connexion pour la transaction en cours. Pour un scnario associ au tSAPCommit, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

103

tSAPConnection

tSAPConnection

Proprits du tSAPConnection
Famille de composant Fonction Objectif Basic settings Business Le composant tSAPConnection ouvre une connexion vers un systme SAP afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers un systme SAP. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Connection configura- Client type : Saisissez votre code de connexion SAP tion habituel. Userid : Saisissez lidentifiant de connexion utilisateur. Password : Saisissez le mot de passe. Language : Spcifiez la langue. Host name : Saisissez ladresse IP du systme SAP. System number : Saisissez le numro du systme. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec les composants SAP. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario 1 : Rcuprer les mtadonnes dun systme SAP .

104

Guide de Rfrence des Composants Talend Open Studio

tSAPInput

tSAPInput

Proprits du tSAPInput
Famille de composant Fonction Objectif Basic settings Business Le composant tSAPInput se connecte un systme SAP via ladresse IP du systme. Il permet dextraire des donnes dun systme SAP nimporte quel niveau en faisant appel des fonctions RFC ou BAPI. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant connexion de base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez la case et cliquez sur le composant de tion connexion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide Utilisateur de votre Studio. Connection configura- Client : Saisissez votre code de connexion SAP habition tuel. Userid : Saisissez lidentifiant de connexion utilisateur. Password : Saisissez le mot de passe. Language : Spcifiez la langue.

Guide de Rfrence des Composants Talend Open Studio

105

Proprits du tSAPInput

Host name : Saisissez ladresse IP du systme SAP. System number : Saisissez le numro du systme. FunName Initialize input Saisissez le nom de la fonction que vous souhaitez utiliser pour rcuprer les donnes. Configurez les paramtres dentre. Parameter Value : Saisissez entre guillemets les valeurs correspondant au paramtre dfini dans la colonne Parameter Name. Type : Slectionnez le type dentre rcuprer. Table Name (Structure Name) : Saisissez entre guillemets le nom de la table. Parameter Name : Saisissez entre guillemets le nom du champ correspondant la table dfinie dans la colonne Table Name. Lorsque plusieurs valeurs de paramtres utilisent le mme nom de paramtre, vous devez saisir ces valeurs dans une seule ligne et les sparer par des virgules. Outputs Configurez les paramtres des schmas transmettre en sortie. Schema : Saisissez le nom du schma transmettre en sortie. Type (for iterate) : Slectionnez le type de sortie que vous souhaitez obtenir. Table Name (Structure Name) : Saisissez entre guillemets le nom de la table. Mapping : Saisissez entre guillemets le nom des champs dont vous souhaitez rcuprer les donnes. Vous pouvez dfinir autant de liens de sortie Main pour crire des donnes que de schmas ajouts au tableau Outputs. Ainsi, les donnes peuvent tre groupes dans diffrents fichiers. Connections Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : RunIf, OnComponentOk; OnComponentError, OnSubjobOk, OnSubjobError. Liens dentre (dun composant un autre) : Row : Iterate Trigger : Runif, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError.

106

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Rcuprer les mtadonnes dun systme SAP

Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio. Advanced settings Release Connection Dcochez cette case afin de continuer utiliser la connexion slectionne, une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis en tant que composant de dbut et requiert un composant de sortie. n/a

Scnario 1 : Rcuprer les mtadonnes dun systme SAP


Les composants SAP (tSAPInput et tSAPOutput) ainsi que lassistant SAP sont bass sur des bibliothques valides et fournies par SAP (JCO) permettant lutilisateur dappeler les fonctions RFC ou BAPI et de rcuprer les donnes du systme SAP au niveau des tables, RFC ou BAPI. Ce scnario utilise lassistant SAP guidant lutilisateur travers les diffrentes tapes de cration de connexions SAP et des fonctions RFC et BAPI. Lassistant SAP est uniquement disponible pour les utilisateurs Talend Enterprise. Si vous tes utilisateur de Talend Open Studio ou Talend Integration Express, vous devez configurer les proprits du composant tSAPInput manuellement. Ce scnario Java utilise un assistant SAP pour crer une connexion au systme SAP, appelle une fonction BAPI pour rcuprer les informations dune entreprise stockes dans le systme SAP et les affiche dans Talend Open Studio. Les figures ci-dessous affichent les paramtres du systme SAP permettant daccder aux informations sur lentreprise que vous souhaitez lire dans Talend Open Studio laide du composant tSAPInput.

Guide de Rfrence des Composants Talend Open Studio

107

Scnario 1 : Rcuprer les mtadonnes dun systme SAP

Crez une connexion au systme SAP laide de lassistant SAP. Dans ce scnario, la connexion SAP est appele sap. Appelez la fonction BAPI appele BAPI_COMPANY_GETDETAIL laide de lassistant SAP pour accder au document html BAPI stock dans le systme SAP et consultez les informations sur lentreprise. Dans le champ Name filter, saisissez BAPI* et cliquez sur le bouton Search pour afficher toutes les fonctions BAPI disponibles. Slectionnez BAPI_COMPANY_GETDETAIL pour afficher le schma dcrivant les informations de lentreprise. La vue droite de lassistant affiche les mtadonnes de la fonction BAPI_COMPANY_GETDETAIL et vous permet de configurer les paramtres ncessaires. La vue Document affiche le document HTML SAP de la fonction BAPI_COMPANY_GETDETAIL. La vue Parameter fournit les informations sur les paramtres dentre et de sortie ncessaire la fonction BAPI_COMPANY_GETDETAIL pour retourner les valeurs. Dans la vue Parameter, cliquez sur longlet Input pour lister le ou les paramtre(s) dentre. Dans ce scnario, il ny a quun seul paramtre dentre requis par la fonction BAPI_COMPANY_GETDETAIL. Ce paramtre sappelle COMPANYID.

108

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Rcuprer les mtadonnes dun systme SAP

Dans la vue Parameter, cliquez sur longlet Output pour lister les paramtres de sortie retourns par la fonction BAPI_COMPANY_GETDETAIL. Dans ce scnario, il y a deux paramtres de sortie : COMPANY_DETAIL et RETURN.

Chacun des paramtres de structure est compos de nombreux paramtres single. La vue Test it permet dajouter ou de supprimer des paramtres dentre en fonction de la fonction appele. Dans ce scnario, lobjectif est de rcuprer les mtadonnes du paramtre structure appel COMPANY_DETAIL qui est compos de 14 paramtres single.

Guide de Rfrence des Composants Talend Open Studio

109

Scnario 1 : Rcuprer les mtadonnes dun systme SAP

Dans la colonne Value de la ligne COMPANYID du premier tableau, saisissez 000001 afin de retourner les donnes correspondant lentreprise dont lidentifiant est 000001. Dans la liste Output type en bas de lassistant, slectionnez output.table. Cliquez sur Launch en bas de la vue pour afficher la valeur de chaque paramtre single retourn par la fonction BAPI_COMPANY_GETDETAIL. Cliquez sur Finish pour fermer lassistant et crer la connexion. La connexion sap et la fonction BAPI_COMPANY_GETDETAIL apparaissent sous le nud SAP Connections du Repository. Pour rcuprer les diffrents schmas de la fonction BAPI_COMPANY_GETDETAIL : Cliquez-droit sur BAPI_COMPANY_GETDETAIL dans le Repository. Slectionnez Retrieve schema dans le menu. Dans lassistant qui souvre, slectionnez les schmas que vous souhaitez rcuprer. Ici, slectionnez les deux schmas : COMPANY_DETAIL et RETURN. Cliquez sur Next pour afficher ces diffrents schmas. Cliquez sur Finish. Les deux schmas apparaissent sous la fonction BAPI_COMPANY_GETDETAIL dans le Repository.

110

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Rcuprer les mtadonnes dun systme SAP

Dans ce scnario, lobjectif est de rcuprer les donnes correspondant lentreprise dont lidentifiant est 000001 pour les afficher dans Talend Open Studio : Dans le Repository, slectionnez la connexion SAP que vous venez de crer et glissez-la dans lespace de modlisation, slectionnez tSAPConnection dans la liste de composants et cliquez sur OK. Le composant tSAPConnection portant le nom de votre connexion, sap, sera ajout votre Job et ouvrira une connexion SAP. Double-cliquez sur le tSAPConnection pour afficher la vue Component :

Si vous avez utiliser les mtadonnes pour crer le composant, le mode Repository est slectionn dans la liste Property Type et les champs suivants sont automatiquement renseigns. Si vous nutilisez pas les mtadonnes, slectionnez le mode Built-In et renseignez les champs suivants manuellement. Dans le Repository, slectionnez le schma BAPI_COMPANY_GETDETAIL dans le dossier sap, et glissez-le dans lespace de modlisation, slectionnez tSAPInput dans la liste de composants et cliquez sur OK. Cliquez et dposez les composants tFilterColumns et tLogRow dans lespace de modlisation. Connectez le tSAPConnection au tSAPInput via un lien Trigger > OnSubJobOk. Pour connecter le tSAPInput au tLogRow, cliquez-droit sur le tSAPInput, slectionnez Row puis row_COMPANY_DETAIL_1 dans le menu et cliquez sur le composant tLogRow.

Guide de Rfrence des Composants Talend Open Studio

111

Scnario 1 : Rcuprer les mtadonnes dun systme SAP

Dans lespace de modlisation, slectionnez le composant tSAPInput et cliquez sur la vue Component pour afficher ses proprits. Les proprits du composant tSAPInput apparaissent automatiquement puisque le schma est stock dans le dossier Metadata et que le composant est initialis par lassistant SAP.

Dans la vue Component, cochez la case Use an existing connection et slectionnez le composant tSAPConnection dans la liste Component list pour utiliser la connexion ouverte par le composant de connexion. Dans la zone Initialize input, vous pouvez voir les paramtres dentre ncessaires la fonction BAPI_COMPANY_GETDETAIL. Dans la zone Outputs, vous pouvez voir les diffrents schmas de la fonction BAPI_COMPANY_GETDETAIL, notamment le schma COMPANY_DETAIL que vous rcuprez en sortie. Dans lespace de modlisation, slectionnez le composant tLogRow et cliquez sur la vue Component pour paramtrer ses proprits. Pour plus dinformations, consultez la section intitule tLogRow Enregistrez le Job et appuyez sur F6 pour lexcuter.

112

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE

Le composant tSAPInput rcupre du systme SAP les mtadonnes du paramtre COMPANY_DETAIL de type structure et le composant tLogRow affiche les informations dans la console.

Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE


Les composants SAP (tSAPInput et tSAPOutput) ainsi que lassistant SAP sont bass sur des bibliothques valides et fournies par SAP (JCO) permettant lutilisateur dappeler les fonctions RFC ou BAPI et de rcuprer les donnes du systme SAP au niveau des tables, RFC ou BAPI. Ce scnario utilise lassistant SAP guidant lutilisateur travers les diffrentes tapes de cration de connexions SAP et des fonctions RFC et BAPI. Lassistant SAP est uniquement disponible pour les utilisateurs Talend Enterprise. Si vous tes utilisateur de Talend Open Studio ou Talend Integration Express, vous devez configurer les proprits du composant tSAPInput manuellement. Ce scnario Java utilise lassistant SAP pour crer une connexion au systme SAP et pour appeler une fonction RFC permettant de lire directement dans une table appele SFLIGHT partir du systme SAP. Puis, il affiche dans Talend Open Studio les diffrentes structures de la table SFLIGHT stocke dans le systme SAP. Crez une connexion au systme SAP laide de lassistant SAP. Dans ce scnario, la connexion SAP est appele sap. Appelez la fonction RFC appele RFC_READ_TABLE laide de lassistant SAP pour accder la table du systme SAP et pour visualiser sa structure. Dans le champ Name filter, saisissez RFC* et cliquez sur le bouton Search pour afficher toutes les fonctions RFC disponibles.

Guide de Rfrence des Composants Talend Open Studio

113

Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE

Slectionnez RFC_READ_TABLE pour afficher les schmas de cette fonction. La vue droite de lassistant affiche les mtadonnes de la fonction RFC_READ_TABLE et permet de dfinir les paramtres ncessaires. Longlet Document affiche le document html SAP de la fonction RFC_READ_TABLE. Longlet Parameter fournit les informations sur les paramtres requis par la fonction RFC_READ_TABLE pour pouvoir retourner les valeurs des paramtres. Dans la vue Parameter, cliquez sur longlet Table pour obtenir une description de la structure des diffrentes tables de la fonction RFC_READ_TABLE.

114

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE

La vue Test it vous permet dajouter ou de supprimer des paramtres dentre en fonction de la fonction appele. Dans ce scnario, lobjectif est de rcuprer les diffrentes structures de la table SFLIGHT.

Dans la colonne Value de la ligne DELIMITER du premier tableau, saisissez ; comme sparateur de champ. Dans la colonne Value de la ligne QUERY_TABLE, saisissez SFLIGHT comme table requter. Dans la liste Output type en bas de lassistant, slectionnez output.table. Dans la liste Constructure|Table, slectionnez DATA. Cliquez sur Launch en bas de la vue pour afficher les valeurs de paramtres retournes par la fonction RFC_READ_TABLE. Dans ce scnario, le dlimiteur est ; et la table lire est SFLIGHT. Cliquez sur Finish pour fermer lassistant et crer la connexion. La connexion sap et la fonction RFC_READ_TABLE apparaissent sous le noeud SAP Connections du Repository. Pour rcuprer les diffrents schmas de la fonction RFC_READ_TABLE :

Guide de Rfrence des Composants Talend Open Studio

115

Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE

Cliquez-droit sur RFC_READ_TABLE dans le Repository, et slectionnez Retrieve schema dans le menu. Dans lassistant qui souvre, slectionnez les schmas que vous souhaitez rcuprer. Ici, slectionnez les trois schmas : DATA, FIELDS et OPTIONS. Cliquez sur Next pour afficher ces diffrents schmas. Cliquez sur Finish. Les trois schmas apparaissent sous la fonction RFC_READ_TABLE dans le Repository.

Dans ce scnario, lobjectif est de rcuprer les donnes et le nom des colonnes de la table SFLIGHT pour les rcuprer et les afficher dans Talend Open Studio. Ainsi, intressez-vous uniquement au schma DATA et FIELDS : Dans le Repository, slectionnez la fonction RFC_READ_TABLE de la connexion sap et glissez-la dans lespace de modlisation, slectionnez tSAPInput dans la liste de composants et cliquez sur OK. Cliquez et dposez deux composants tLogRow dans lespace de modlisation. Pour connecter les composants entre eux : Cliquez-droit sur le tSAPInput, slectionnez Row puis row_DATA_1 dans le menu et cliquez sur le premier composant tLogRow. Cliquez-droit sur le tSAPInput, slectionnez Row puis row_FIELDS_1 dans le menu et cliquez sur le deuxime composant tLogRow.

Dans lespace de modlisation, double-cliquez sur tSAPInput pour afficher ses proprits dans la vue Component.

116

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE

Les proprits du composant tSAPInput apparaissent automatiquement puisque le schma est stock dans le dossier Metadata et que le composant est initialis par lassistant SAP. Dans la zone Initialize input, vous pouvez voir les paramtres dentre ncessaires pour la fonction RFC_READ_TABLE, savoir le sparateur de champ ; et le nom de la table SFLIGHT. Dans la zone Outputs, vous pouvez voir les diffrents schmas de la table SFLIGHT, notamment FIELDS et DATA qui sont chacun dirigs vers des flux de sortie diffrents.

Dans lespace de modlisation, slectionnez les composants tLogRow et cliquez sur la vue Component pour paramtrer leurs proprits. Pour plus dinformations, consultez la section intitule tLogRow Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

117

Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE

Le composant tSAPInput rcupre le nom des colonnes de la table SFLIGHT et les donnes correspondantes partir du systme SAP et les composants tLogRow les affichent sous forme de table dans la console.

118

Guide de Rfrence des Composants Talend Open Studio

tSAPOutput

tSAPOutput

Proprits du tSAPOutput
Famille de composant Fonction Objectif Basic settings Business Le composant tSAPOutput crit dans un systme SAP. Il permet dcrire des donnes dans un systme SAP. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant connexion de base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez la case et cliquez sur le composant de tion connexion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient le Job parent et le Job enfant, la liste Component list prsente uniquement les composants de connexion du mme niveau de Job. Si vous souhaitez utiliser une connexion existant dans un autre niveau de Job, vous pouvez utiliser longlet Dynamic settings, afin de partager la connexion en question. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct. Pour plus dinformations concernant longlet Dynamic settings, consultez le Guide utilisateur de votre Studio. Connection configura- Client type : Saisissez votre code de connexion SAP tion habituel. Userid : Saisissez lidentifiant de connexion utilisateur. Password : Saisissez le mot de passe. Language : Spcifiez la langue. Host name : Saisissez ladresse IP du systme SAP.

Guide de Rfrence des Composants Talend Open Studio

119

Scnarios associs

System number : Saisissez le numro du systme. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous effectuez des modifications, le schma passera automatiquement en built-in. FunName Mapping Advanced settings Release Connection Saisissez le nom de la fonction que vous souhaitez utiliser pour rcuprer les donnes. Configurez les paramtres afin de slectionner les donnes crire dans le systme SAP. Dcochez cette case afin de continuer utiliser la connexion slectionne, une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis en tant que composant de sortie et requiert un composant dentre. n/a

Scnarios associs
Pour des scnarios associs, consultez la section intitule Scnario 1 : Rcuprer les mtadonnes dun systme SAP et la section intitule Scnario 2 : Lire les donnes des diffrents schmas de la fonction RFC_READ_TABLE .

120

Guide de Rfrence des Composants Talend Open Studio

tSAPRollback

tSAPRollback

Proprits du tSAPRollback
Ce composant est troitement li aux composants tSAPCommit et tSAPConnection. Ils sont gnralement utiliss ensemble lors de transactions.. Component family Function Purpose Basic settings Business/SAP tSAPRollback annule la transaction dans le SAP connect. tSAPRollback vite le commit de transaction involontaire. SAPConnection ponent list Com- Slectionnez le composant de connexion tSAPConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case afin de continuer utiliser la connexion slectionne, une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Release Connection

Advanced settings Usage Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis avec des composants SAP et notamment avec les composants tSAPConnection et tSAPCommit. n/a

Scnario associ
Pour un scnario associ au tSAPRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMysqlRollback.

Guide de Rfrence des Composants Talend Open Studio

121

tSugarCRMInput

tSugarCRMInput

Proprits du tSugarCRMInput
Famille du composant Fonction Objectif Basic settings Business/Cloud Le tSugarCRMInput se connecte un module de la base de donnes SugarCRM via le service Web adquat. Le tSugarCRMInput permet dextraire les donnes dune base de donnes SugarCRM laide dune requte. SugarCRM Webservice Saisissez lURL du service Web permettant de se URL connecter la base de donnes SugarCRM. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Module Slectionnez le module adquat dans la liste. Pour utiliser des tables personnalises, slectionnez Use custom module dans la liste . Les champs Custom module package name et Custom module name qui saffichent sont automatiquement remplis avec les noms correspondants. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Query condition Advanced settings Utilisation Limitation tStatCatcher Statistics Saisissez la requte permettant de slectionner les donnes extraire. Exemple : account_name= Talend Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis en tant que composant de dbut. Un composant de sortie est ncessaire. n/a

Scnario: Extraire les donnes dun compte partir de SugarCRM


Ce scnario dcrit un Job deux composants visant extraire les informations dun compte partir dune base de donnes SugarCRM vers un fichier de sortie Excel.

122

Guide de Rfrence des Composants Talend Open Studio

Scnario: Extraire les donnes dun compte partir de SugarCRM

A partir de la Palette, cliquez-dposez un composant tSugarCRMInput et un composant tFileOutputExcel. Connectez les composants dentre et de sortie laide dun lien de type Row Main. Dans la vue Component du tSugarCRMInput, remplissez les informations de connexion dans les champs SugarCRM Web Service URL, Username et Password. Slectionnez ensuite le module adquat parmi ceux proposs dans la liste Module. Dans cet exemple, cest Accounts qui est slectionn.

Le champ Schema est automatiquement renseign en fonction du module slectionn, mais il est possible de le modifier et de supprimer les colonnes dont vous navez pas besoin en sortie. Dans le champ Query Condition, saisissez la requte que vous voulez utiliser pour extraire les donnes du CRM. Dans cet exemple : billing_address_city=Sunnyvale Slectionnez ensuite le composant tFileOutputExcel.

Renseignez le nom du fichier de destination dans le champ File Name ainsi que le nom de la feuille de calcul dans le champ Sheet puis cochez la case Include header pour considrer les enttes. Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

123

Scnario: Extraire les donnes dun compte partir de SugarCRM

Les donnes filtres sont inscrites en sortie dans la feuille de calcul du fichier Excel spcifi.

124

Guide de Rfrence des Composants Talend Open Studio

tSugarCRMOutput

tSugarCRMOutput

Proprits du tSugarCRMOutput
Famille du composant Fonction Objectif Basic settings Business/Cloud Le composant tSugarCRMOutput crit dans un module de la base de donnes SugarCRM via le service Web adquat. Le tSugarCRMOutput permet dcrire des donnes dans une base de donnes SugarCRM. SugarCRM WebService Saisissez lURL du service Web permettant de se URL connecter la base de donnes SugarCRM. Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Module Slectionnez le module adquat dans la liste. Pour utiliser des tables personnalises, slectionnez Use custom module dans la liste . Les champs Custom module package name et Custom module name qui saffichent sont automatiquement remplis avec les noms correspondants. Action Vous pouvez effectuer lune des oprations suivantes sur les donnes du module SugarCRM : Insert : insrer les donnes. Update : mettre les donnes jour. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Guide de Rfrence des Composants Talend Open Studio

125

Scnario associ

Scnario associ
Aucun scnario nest disponible pour ce composant.

126

Guide de Rfrence des Composants Talend Open Studio

tVtigerCRMInput

tVtigerCRMInput

Proprits du tVtigerCRMInput
Famille du composant Fonction Objectif Basic settings Vtiger Version Vtiger 5.0 Slectionnez la version du Vtiger Web Services que vous souhaitez utiliser. Server Address Port Vtiger Path Saisissez ladresse IP du serveur VtigerCRM. Saisissez le numro de port daccs au serveur. Saisissez le chemin daccs au serveur Business/tVtigerCRM Le tVtigerCRMInput se connecte un module de la base de donnes vTigerCRM via le service Web adquat. Le tVtigerCRMInput permet dextraire les donnes dune base de donnes tVtigerCRM.

Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Version Module Method Renseignez la version de VtigerCRM que vous utilisez. Slectionnez le module adquat dans la liste. Slectionnez la mthode adquate dans la liste. Cette mthode permet de dterminer laction appliquer au module VtigerCRM slectionn.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Vtiger 5.1 Endpoint Username Access key Action Saisissez lURL du serveur Web invoqu. Saisissez le nom dutilisateur afin de vous connecter au VtigerCRM.. Saisissez la cl daccs pour le nom dutilisateur. Vous pouvez effectuer lune des oprations suivantes sur les donnes du module SugarCRM : Insert : insrer les donnes. Update : mettre les donnes jour. Module Slectionnez le module adquat dans la liste. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au com-

Guide de Rfrence des Composants Talend Open Studio

127

Scnario associ

posant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Query condition Saisissez la requte permettant de slectionner les donnes extraire.

Manual input of SQL Cochez cette case pour saisir manuellement la requte query que vous souhaitez effectuer dans le champ Query. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis en tant que composant de dbut. Un composant de sortie est ncessaire. n/a

Scnario associ
Aucun scnario nest disponible pour ce composant.

128

Guide de Rfrence des Composants Talend Open Studio

tVtigerCRMOutput

tVtigerCRMOutput

Proprits du tVtigerCRMOutput
Famille du composant Fonction Objectif Basic settings Vtiger Version Vtiger 5.0 Slectionnez la version du Vtiger Web Services que vous souhaitez utiliser. Server Address Port Vtiger Path Saisissez ladresse IP du serveur VtigerCRM. Saisissez le numro de port daccs au serveur. Saisissez le chemin daccs au serveur. Business/VtigerCRM Le composant tVtigerCRMOutput crit dans un module de la base de donnes VtigerCRM via le service Web adquat. Le tVtigerCRMOutput permet dcrire des donnes dans une base de donnes VtigerCRM.

Username et Password Saisissez les informations dauthentification de lutilisateur au service Web. Version Module Method Renseignez la version de VtigerCRM que vous utilisez. Slectionnez le module adquat dans la liste. Slectionnez la mthode adquate dans la liste. Cette mthode permet de dterminer laction appliquer au module VtigerCRM slectionn.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in.. Pour ce composant, le schma dpend du Module slectionn. Vtiger 5.1 Endpoint Username Access key Action Saisissez lURL du serveur Web invoqu. Saisissez le nom dutilisateur afin de vous connecter au VtigerCRM.. Saisissez la cl daccs pour le nom dutilisateur. Vous pouvez effectuer lune des oprations suivantes sur les donnes du module VtigerCRM : Insert : insrer les donnes. Update : mettre les donnes jour. Module Slectionnez le module adquat dans la liste. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au com-

Guide de Rfrence des Composants Talend Open Studio

129

Scnario associ

posant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Pour ce composant, le schma dpend du Module slectionn. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est utilis comme composant de sortie. Il ncessite un composant dentre. n/a

Scnario associ
Aucun scnario nest disponible pour ce composant.

130

Guide de Rfrence des Composants Talend Open Studio

Composants Business Intelligence


Ce chapitre passe en revue les principaux composants prsents dans le groupe Business Intelligence de la Palette de Talend Open Studio. La famille BI regroupe tous les connecteurs couvrant des besoins tels que la lecture et lcriture de bases de donnes multidimensionnelles ou OLAP, la gnration de rapports Jasper, le suivi des modifications de bases de donnes laide de tables Slow Changing Dimension, etc.

Guide de Rfrence des Composants Talend Open Studio

tBarChart

tBarChart

Proprits du tBarChart
Famille du composant Fonction Objectif Basic settings Business gence/Charts Intelli-

Le composant tBarChart lit des donnes partir dun flux dentre et transforme les donnes en diagramme en barres dans un fichier image au format PNG. Le composant tBarChart gnre un diagramme en barres partir des donnes dentre afin de faciliter lanalyse technique. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Le schma du tBarChart contient trois colonnes en lecture seule nommes respectivement series (type String), category (type String), et value (type Integer), selon un ordre prdtermin. Les donnes de toutes les autres colonnes seront simplement passes au composant suivant, sil y en a un, mais elles ne seront pas prsentes dans le diagramme en barres. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide Utilisateur de Talend Open Studio. Sync columns Permet de synchroniser le schma du fichier dentre avec le schma du fichier de sortie. La fonction Sync ne saffiche que lorsquune connexion de type Row est connecte au composant de sortie. Nom et chemin daccs du fichier image de sortie. Saisissez le titre du diagramme en barres gnrer. Cochez cette case si vous souhaitez inclure une lgende votre diagramme en barres, afin dafficher toutes les sries (series) dans des couleurs diffrentes. Cochez cette case afin de crer une image en trois dimensions. Par dfaut, cette case est coche et les barres reprsentant les sries (series) de chaque catgorie (category) sont empiles les unes sur les autres. Si cette case est dcoche, une image en deux dimensions est cre, et les barres saffichent les unes ct des autres le long de laxe category.

Generated image path Chart title Include legend

3Dimensions

Image width et Image Saisissez la largeur et la hauteur du fichier image, expriheight mes en pixels.

132

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un diagramme en barres partir de donnes dentre

Category axis name et Saisissez le nom de laxe category et le nom de laxe value. Value axis name Foreground alpha Saisissez un entier entre 0 et 100 afin de dfinir la transparence de limage. Plus ce nombre est petit, plus votre image sera transparente. Choisissez lorientation quaura votre diagramme en barres: VERTICAL ou HORIZONTAL. Cochez cette case pour collecter les donnes de log au niveau du composant.

Plot orientation Advanced settings Utilisation tStatCatcher Statistics

Ce composant est un composant de sortie. Par consquent, il requiert un composant dentre ainsi quune connexion de type Row Main.

Scnario : Crer un diagramme en barres partir de donnes dentre


Ce scnario dcrit un Job simple qui lit les donnes dun fichier CSV et les transforme en diagramme en barres. Le fichier dentre est prsent ci-dessous :

Le fichier dentre ayant une structure diffrente de celle requise pour lutilisation dun tBarChart, un tMap sera utilis dans ce scnario, afin de mettre en correspondance les donnes avec un fichier CSV trois colonnes, avant dutiliser le tBarChart pour gnrer un fichier reprsentant le diagramme en barres. Le tMap est gnralement utilis afin dadapter le schma dentre conformment la structure du schma du composant tBarChart. Pour plus dinformations concernant le composant tMap, consultez le Guide utilisateur Talend Open Studio ainsi que la section intitule tMap .

Guide de Rfrence des Composants Talend Open Studio

133

Scnario : Crer un diagramme en barres partir de donnes dentre

A partir de la Palette, dposez les composants suivants dans lespace de modlisation graphique : deux composants tFileInputDelimited, un tMap, trois composants tFileOutputDelimited et un tBarChart. Renommez les composants comme vous le souhaitez pour faciliter le travail de conception. Double-cliquez sur le premier composant tFileInputDelimited afin dafficher longlet Basic settings de sa vue Component.

Renseignez le chemin daccs au fichier traiter dans le champ File name. Spcifiez dans le champ Header le nombre de lignes den-tte. Dans ce scnario, il ny a quune seule ligne. Laissez les autres paramtres tels quils sont. Cliquez sur Edit schema pour dcrire la structure des donnes du fichier dentre. Dans ce scnario, le schma dentre est compos de quatre colonnes : City, Population, Area, et Density. Une fois les noms de colonnes et les types de donnes dfinis, cliquez sur OK pour fermer la bote de dialogue du schma.

Connectez le tFileInputDelimited au tMap laide dune connexion de type Row > Main. Double-cliquez sur le tMap pour ouvrir lditeur Map Editor.

134

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un diagramme en barres partir de donnes dentre

Cliquez sur le bouton [+] en haut droite de lditeur afin dajouter trois tables de sortie : Population, Area et Density. Les noms de ces tables deviendront le nom des connexions reliant le tMap aux composants de sortie dans lespace de modlisation graphique. Utilisez lditeur Schema editor pour ajouter trois colonnes chacune des tables de sortie : series (type String), category (type String) et value (type Integer). Dans le champ Expression de chaque table de sortie, saisissez les noms des series, comme indiqu ci-dessus. Ces noms apparatront dans la lgende du diagramme en barres. Dposez la colonne City de la table dentre dans la colonne category de chaque table de sortie. Dposez la colonne Population de la table dentre dans la colonne value de la table Population. Dposez la colonne Area de la table dentre dans la colonne value de la table Area. Dposez la colonne Density de la table dentre dans la colonne value de la table Density. Cliquez sur OK pour sauvegarder les mappings et fermer lditeur. Cliquez-droit sur le composant tMap et slectionnez Row > Population pour le connecter au premier composant tFileOutputDelimited. De la mme manire, connectez le tMap aux autres composants tFileOutputDelimited, en utilisant respectivement Area et Density. Double-cliquez sur le premier composant tFileOutputDelimited pour afficher longlet Basic settings de sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

135

Scnario : Crer un diagramme en barres partir de donnes dentre

Dans le champ File Name, dfinissez un fichier CSV dans lequel les flux de donnes mapps seront envoys. Dans cet exemple, nommez le fichier de sortie crer LargeCities_mapped.csv. Ce fichier sera utilis comme fichier dentre pour le composant tBarChart. Si le nom dun fichier existant est spcifi, assurez-vous que la case Append (crire la suite) est dcoche. Laissez les autres paramtres tels quils sont. Pour ce qui est des deux autres composants tFileOutputDelimited, utilisez le mme chemin daccs que celui dfini pour le premier composant tFileOutputDelimited et cochez la case Append. Vrifiez que la case Append est coche afin que tous les flux de donnes mapps aillent dans le mme fichier, sans craser les donnes existantes. Connectez le premier composant tFileInputDelimited au second composant tFileInputDelimited laide dune connexion de type Trigger > OnSubjobOK. Connectez le second composant tFileInputDelimited au tBarChart laide dune connexion de type Row > Main. Double-cliquez sur le second composant tFileInputDelimited afin dafficher longlet Basic settings de sa vue Component.

Renseignez le champ File name avec le chemin daccs au fichier, ainsi que son nom, comme dfini dans chaque composant tFileOutputDelimited. Dans cet exemple, le fichier dentre est LargeCities_mapped.csv. Laissez les autres paramtres tels quils sont. Le schma dentre doit correspondre la structure requise par le composant tBarChart. La structure du schma est donc copie partir du schma tBarChart. Double-cliquez sur le composant tBarChart pour afficher longlet Basic settings de sa vue Component.

136

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un diagramme en barres partir de donnes dentre

Dans le champ Generated image path, renseignez le chemin daccs du fichier image gnrer. Dans le champ Chart title, saisissez un titre pour le diagramme en barres. Renseignez un nom pour les axes category et series. Si ncessaire, dfinissez la taille (la largeur dans le champ Image Width, la hauteur dans le champ Image height) et le degr de transparence de limage (dans le champ Foreground alpha). Dans ce scnario, laissez les paramtres par dfaut. Cliquez sur Edit schema afin douvrir la bote de dialogue du schma.

Copiez toutes les colonnes du schma de sortie dans le schma dentre en cliquant sur la double-flche pointant vers la gauche. Cliquez sur OK pour fermer la bote de dialogue du schma. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Un diagramme en barres est gnr selon les critres dfinis.

Guide de Rfrence des Composants Talend Open Studio

137

Scnario : Crer un diagramme en barres partir de donnes dentre

138

Guide de Rfrence des Composants Talend Open Studio

tDB2SCD

tDB2SCD

Proprits du tDB2SCD
Famille du composant Fonction Objectif Databases/Business Intelligence/DB2 Le composant tDB2SCD reflte et traque les modifications dune table DB2 SCD ddie. Le tDB2SCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Adresse IP du serveur de base de donnes.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

139

Scnario associ

Port Database Table schema

Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide Utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de construire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

tStatCatcher Statistics Debug mode

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

140

Guide de Rfrence des Composants Talend Open Studio

tDB2SCDELT

tDB2SCDELT

Proprits du tDB2SCDELT
Famille du composant Fonction Objectif Databases/Business Intelligence/DB2 Le composant tDB2SCDELT reflte et traque les modifications dune table DB2 SCD ddie. Le tDB2SCDELT adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table DB2 SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tDB2Connection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Source table Nom de la table contenant les donnes filtrer.

Guide de Rfrence des Composants Talend Open Studio

141

Proprits du tDB2SCDELT

Table Action on table

Nom de la table crire. Notez quune seule table peut tre crire la fois pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Surrogate Key Creation Slectionnez dans la liste une colonne utiliser comme cl de substitution. Slectionnez la mthode utiliser pour gnrer la cl de substitution. Pour plus dinformations concernant les mthodes de cration, consultez la section intitule Cls SCD . Source Keys Use SCD Type 1 fields Slectionnez une colonne ou plus utiliser en tant que cl(s) pour assurer lunicit des donnes entrantes. Utilisez le type 1 si vous navez pas besoin de traquer les modifications, pour des corrections typographiques par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Utilisez le type 2 si vous avez besoin de traquer les modifications, pour garder une trace des mises jour effectues par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Start date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de dpart. Vous pouvez slectionner lune des colonnes dentre du schma comme date de dpart (Start Date) dans la table SCD. End Date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de fin pour le journal.

Use SCD Type 2 fields

142

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Lorsque le journal est en mode actif, la colonne End Date a une valeur nulle ; pour viter cela, vous pouvez slectionner loption Fixed Year value et saisir une anne fictive. Log Active Status : Ajoute une colonne votre schma SCD pour renseigner les valeurs de statut true et false. Cette colonne permet de reprer facilement le journal actif. Log versions : Ajoute une colonne votre schma SCD pour renseigner le numro de version du journal. Advanced settings Debug mode tStatCatcher Statistics Utilisation Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie et une connexion de type Row Main.

Scnario associ
Pour un scnario associ, consultez la section intitule tFileInputJSON , ainsi que la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

Guide de Rfrence des Composants Talend Open Studio

143

tGreenplumSCD

tGreenplumSCD

Proprits du tGreenplumSCD
Famille du composant Fonction Objectif Databases/Business Intelligence/Greenplum Le composant tGreenplumSCD reflte et traque les modifications dune table Greenplum SCD ddie. Le tGreenplumSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez un tGreenplumtion Connection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de la base de donnes.

144

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Table

Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de constuire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

tStatCatcher Statistics Debug mode

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

Guide de Rfrence des Composants Talend Open Studio

145

tInformixSCD

tInformixSCD

Proprits du tInformixSCD
Component family Fonction Objectif Databases/Business Intelligence/Informix Le composant tInformixSCD reflte et traque les modifications dune table Informix SCD ddie. Le tInformixSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma de la base de donnes.

Basic settings

146

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Instance Table Nom de linstance Informix utiliser. Cette information se trouve gnralement dans le fichier SQL hosts. Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de constuire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Use Transaction Die on error saving Cochez cette case pour amliorer les performances du systme. Dcochez cette case lorsque la base de donnes est configure en mode NO_LOG. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

tStatCatcher Statistics Debug mode

Usage

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 du composant tMysqlSCD.

Guide de Rfrence des Composants Talend Open Studio

147

tIngresSCD

tIngresSCD

Proprits du tIngresSCD
Component family Fonction Objectif Databases/Business Intelligence/Ingres Le composant tIngresSCD reflte et traque les modifications dune table Ingres SCD ddie. Le tIngresSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Server Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de la base de donnes.

148

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Table

Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de construire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

tStatCatcher Statistics Debug mode

Usage

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 du composant tMysqlSCD.

Guide de Rfrence des Composants Talend Open Studio

149

tJasperOutput

tJasperOutput

Proprits du tJasperOutput
Ce composant est troitement li l'outil de reporting de Jaspersoft, iReport. Il lit et traite des donnes d'un flux d'entre afin de crer un rapport l'aide d'un modle de rapport JRXML dfini dans iReport. Famille de composant Fonction Objectif Basic settings Business gence/Jasper Intelli-

Le composant tJasperOutput lit et traite des donnes d'un flux d'entre afin de crer un rapport l'aide d'un modle de rapport JRXML dfini dans iReport. Ce composant vous permet d'utiliser l'outil iReport de Jaspersoft afin de crer un rapport dans des formats riches. Jrxml file Temp path Destination path File name/Stream Report type Fichier du modle de rapport cr dans iReport. Chemin d'accs aux fichiers temporaires. Chemin d'accs au fichier final du rapport. Nom du rapport final. Type du fichier du rapport final.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Sync columns Permet de synchroniser le schma du fichier dentre avec le schma du fichier de sortie. La fonction Sync ne saffiche que lorsquune connexion de type Row est connecte au composant de sortie. Editez la commande pour fournir le chemin d'accs au fichier d'excution de iReport, par exemple en remplaant __IREPORT_PATH__\ par E:\Program Files\Jaspersoft\iReport-4.1.1\bin\, ou en saisissant le chemin d'accs complet au fichier d'excution, par exemple "E:\Program Files\Jaspersoft\iReport-4.1.1\bin\iReport.exe". Cliquez sur ce bouton pour lancer iReport. Cochez cette case pour collecter les donnes de log au niveau du composant.

iReport

Launch Advanced settings Utilisation tStatCatcher Statistics

Ce composant est troitement li l'outil de reporting de Jaspersoft, iReport. Il lit et traite des donnes d'un flux d'entre afin de crer un rapport l'aide d'un modle de rapport JRXML dfini dans iReport.

150

Guide de Rfrence des Composants Talend Open Studio

Scnario : Gnrer un rapport avec un modle .jrxml

Limitation

n/a

Scnario : Gnrer un rapport avec un modle .jrxml


Le Job suivant lit des donnes d'un fichier .csv et cre un rapport .pdf bas sur un modle de rapport .jrxml existant. Notez que le fichier de modle doit avoir t cr via l'outil iReport de Jaspersoft partir d'un fichier partageant le mme schma avec le fichier source .csv du Job. 1. Glissez-dposez les composants suivants de la Palette dans l'espace de modlisation graphique : tFileInputDelimited et tJasperOutput. 2. Reliez le tFileInputDelimited au tJasperOutput l'aide d'un lien Row.

3. Double-cliquez sur le composant tFileInputDelimited afin d'afficher sa vue Basic settings.

4. Slectionnez Built-In dans la liste droulante Property Type. Vous pouvez slectionner Repository dans la liste Property Type afin de renseigner automatiquement les champs correspondants si la mtadonne a t stocke localement dans le Repository. Pour plus d'informations concernant les mtadonnes Metadata, consultez le Guide utilisateur de Talend Open Studio. 5. Renseignez le champ File name/Stream en saisissant le chemin d'accs et le nom du fichier source, par exemple "C:/Documents and Settings/Andy ZHANG/nom.csv". 6. Laissez les paramtres par dfaut pour les champs Row Separator et Field Separator. Cependant, si ncessaire, vous pouvez les modifier selon vos besoins. 7. Saisissez 1 dans le champ Header et 0 dans le champ Footer. Laissez le champ Limit vide. Cependant, si ncessaire, vous pouvez les modifier selon vos besoins. 8. Slectionnez Built-In dans la liste droulante Schema puis cliquez sur Edit schema afin de dfinir la structure des donnes du fichier d'entre. Dans ce cas, le fichier d'entre contient deux colonnes : Nom et Prenom.

Guide de Rfrence des Composants Talend Open Studio

151

Scnario : Gnrer un rapport avec un modle .jrxml

9. Double-cliquez sur le tJasperOutput pour afficher sa vue Basic settings et configurer ses proprits.

10.Saisissez le chemin d'accs complet au fichier de modle du rapport cr via l'outil iReport de Jaspersoft dans le champ Jrxml file. Vous pouvez galement cliquer sur le bouton [...] afin de parcourir votre systme. Le schma du fichier utilis pour crer un modle .jrxml via iReport, doit tre le mme que celui du fichier source utilis pour crer le rapport. 11.Dans le champ Temp path, saisissez le chemin d'accs aux fichiers temporaires gnrs durant l'excution du Job. Vous pouvez galement cliquez sur le bouton [...] afin de parcourir votre systme. 12.Saisissez le chemin d'accs au rapport final gnr durant l'excution du Job, dans le champ Destination path. Vous pouvez galement cliquer sur le bouton [...] afin de parcourir votre systme. 13.Saisissez le nom du rapport final gnr durant l'excution du Job, dans le champ File name/Stream. 14.Dans le champ Report type, slectionnez le format du rapport final. 15.Cliquez sur Sync columns afin de rcuprer le schma du composant prcdent. 16.Saisissez le chemin d'accs au fichier d'excution de iReport dans le champ iReport, en remplaant par exemple __IREPORT_PATH__\ par E:\Program Files\Jaspersoft\iReport-4.1.1\bin\. Vous pouvez cliquer sur le bouton Launch afin de lancer iReport. Cette tape n'est pas obligatoire. Cependant, elle vous permet d'accder l'outil iReport pour effectuer les oprations ncessaires, comme la cration d'un modle de rapport, etc. 17.Sauvegardez le Job et appuyez sur F6 pour l'excuter. Le fichier out.pdf est cr l'emplacement spcifi dans le champ Destination path.

152

Guide de Rfrence des Composants Talend Open Studio

tJasperOutputExec

tJasperOutputExec

Proprits du tJasperOutputExec
Ce composant est troitement li l'outil de reporting de Jaspersoft, iReport. Il lit et traite des donnes d'un fichier afin de crer un rapport l'aide d'un modle de rapport .jrxml dfini via iReport. Ce composant permet un gain de performance, car il est la combinaison d'un composant d'entre et d'un composant tJasperOutput. L'utilisation de ces deux composants spars permet de transformer les donnes avant de les utiliser pour gnrer un rapport, avec des sources riches et varies en entre. Famille de composant Fonction Objectif Business gence/Jasper Intelli-

Le composant tJasperOutputExec lit et traite des donnes partir d'un fichier source pour crer un rapport l'aide d'un modle de rapport .jrxml dfini via iReport. Ce composant vous permet d'utiliser l'outil iReport de Jaspersoft afin de crer un rapport dans des formats riches. Il permet un gain de performance, puisqu'il est la combinaison d'un composant d'entre et du composant de sortie tJasperOutput. Jrxml file Source file Record delimiter Destination path Use Default Name Output Name Fichier du modle de rapport cr dans iReport Nom du fichier source. Saisissez votre dlimiteur d'enregistrements. Chemin d'accs au fichier final du rapport.

Basic settings

Output Cochez cette case pour utiliser le nom par dfaut du rapport gnr, c'est--dire le nom du fichier source. Nom du rapport final. Ce champ n'apparat pas si la case Use Default Output Name est coche.

Report type iReport

Type du fichier du rapport final. Editez la commande pour fournir le chemin d'accs au fichier d'excution de iReport, par exemple en remplaant __IREPORT_PATH__\ par E:\Program Files\Jaspersoft\iReport-4.1.1\bin\, ou en saisissant le chemin d'accs complet au fichier d'excution, par exemple "E:\Program Files\Jaspersoft\iReport-4.1.1\bin\iReport.exe". Cliquez sur ce bouton pour lancer iReport.

Launch Advanced settings Utilisation

tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Ce composant est troitement li l'outil de reporting de Jaspersoft, iReport. Il lit et traite des donnes partir d'un fichier source pour crer un rapport l'aide d'un modle de rapport .jrxml dfini via iReport. n/a

Limitation

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Gnrer un rapport avec un modle .jrxml .

Guide de Rfrence des Composants Talend Open Studio

153

tLineChart

tLineChart

Proprits du tLineChart
Famille du composant Fonction Objectif Basic settings Business gence/Charts Intelli-

Le composant tLineChart lit des donnes partir dun flux dentre et transforme les donnes en graphique en lignes dans un fichier image au format PNG. Le composant tLineChart gnre un graphique en lignes partir des donnes dentre afin de faciliter lanalyse technique. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Le schma du tLineChart contient trois colonnes en lecture seule nommes respectivement series (type String), category (type String), et value (type Integer), selon un ordre prdtermin. Les donnes de toutes les autres colonnes seront simplement passes au composant suivant, sil y en a un, mais elles ne seront pas prsentes dans le diagramme en barres. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Sync columns Permet de synchroniser le schma du fichier dentre avec le schma du fichier de sortie. La fonction Sync ne saffiche que lorsquune connexion de type Row est connecte au composant de sortie. Nom et chemin daccs du fichier image de sortie. Saisissez le titre du graphique en lignes gnrer.

Generated image path Chart title

Domain axis label and Saisissez le nom de laxe domain (axe X) et le nom de Range axis label laxe range (axe Y). Plot orientation Include legend Choisissez lorientation quaura votre graphique en lignes : VERTICAL ou HORIZONTAL. Saisissez true dans ce champ si vous souhaitez inclure une lgende indiquant les lignes des sries dans des couleurs diffrentes ; sinon, saisissez false.

Image width et Image Saisissez la largeur et la hauteur du fichier image, expriheight mes en pixels. Moving average Cochez cette case afin dafficher la moyenne mobile de chaque srie dans votre graphique en lignes. Lorsque cette

154

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un graphique en lignes afin de faciliter lanalyse des tendances

case est coche, le champ Period apparat et vous pouvez dfinir la priode dans laquelle apparat la moyenne mobile. Lower bound and Upper Dfinissez quelles sont les plus hautes et les plus basses bound valeurs qui seront affiches sur laxe range. Chart background et Choisissez dans la liste la couleur de fond du graphique Plot background ainsi que la couleur de fond du plan du graphique (zone de lorientation). Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant de sortie. Par consquent, il requiert un composant dentre ainsi quune connexion de type Row Main.

Scnario : Crer un graphique en lignes afin de faciliter lanalyse des tendances


Ce scnario dcrit un Job simple qui lit les donnes dun fichier CSV et les transforme en graphique en lignes afin de faciliter lanalyse des tendances. Le fichier dentre indique combien de temps (en minutes) par semaine une personne regarde diffrentes chanes de tlvision, sur une priode de dix semaines, comme prsent ci-dessous :

Le fichier dentre ayant une structure diffrente de celle requise pour lutilisation dun tLineChart, un tMap sera utilis dans ce scnario, afin de mettre en correspondance les donnes avec un fichier CSV ayant la structure requise, avant dutiliser le tLineChart pour gnrer un fichier reprsentant le graphique en lignes. Le tMap est gnralement utilis afin dadapter le schma dentre, conformment la structure du schma du composant tLineChart. Pour plus dinformations concernant le composant tMap, consultez le Guide Utilisateur Talend Open Studio ainsi que le composant la section intitule tMap .

Guide de Rfrence des Composants Talend Open Studio

155

Scnario : Crer un graphique en lignes afin de faciliter lanalyse des tendances

A partir de la Palette, dposez les composants suivants dans lespace de modlisation graphique : deux composants tFileInputDelimited, un tMap, trois composants tFileOutputDelimited et un tLineChart. Renommez les composants comme vous le souhaitez afin quils dcrivent au mieux leur fonction. Double-cliquez sur le premier composant tFileInputDelimited afin dafficher longlet Basic settings de sa vue Component.

Renseignez le chemin daccs au fichier traiter dans le champ File name en parcourant votre rpertoire et en slectionnant le fichier dentre. Spcifiez dans le champ Header le nombre de lignes den-tte. Dans ce scnario, il ny a quune seule ligne. Laissez les autres paramtres tels quils sont. Cliquez sur Edit schema pour dcrire la structure des donnes du fichier dentre. Dans ce scnario, le schma dentre est compos de quatre colonnes : Week, Mins_TVA, Mins_TVB, et Mins_TVC. Une fois les noms de colonnes et les types de donnes dfinis, cliquez sur OK pour fermer la bote de dialogue du schma.

156

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un graphique en lignes afin de faciliter lanalyse des tendances

Connectez le tFileInputDelimited au tMap laide dune connexion de type Row > Main. Double-cliquez sur le tMap pour ouvrir lditeur Map Editor.

Cliquez sur le bouton [+] en haut droite de lditeur afin dajouter trois tables de sortie : TV_A, TV_B, et TV_C. Les noms de ces tables deviendront le nom des connexions reliant le tMap aux composants de sortie dans lespace de modlisation graphique. Utilisez lditeur Schema editor pour ajouter trois colonnes chacune des tables de sortie : series (type String), x (type Integer) et y (type Integer).

Guide de Rfrence des Composants Talend Open Studio

157

Scnario : Crer un graphique en lignes afin de faciliter lanalyse des tendances

Dans le champ Expression de chaque table de sortie, saisissez les noms des series, comme indiqu ci-dessus. Ces noms apparatront dans la lgende du graphique en lignes. Dposez la colonne Week de la table dentre dans la colonne x de chaque table de sortie. Dposez la colonne Mins_TVA de la table dentre dans la colonne y de la table TV_A. Dposez la colonne Mins_TVB de la table dentre dans la colonne y de la table TV_B. Dposez la colonne Mins_TVC de la table dentre dans la colonne value de la table TV_C. Cliquez sur OK pour sauvegarder les mappings et fermer lditeur. Cliquez-droit sur le composant tMap et slectionnez Row > TV_A pour le connecter au premier composant tFileOutputDelimited. De la mme manire, connectez le tMap aux autres composants tFileOutputDelimited, en utilisant respectivement Row > TV_B et Row > TV_C. Double-cliquez sur le premier composant tFileOutputDelimited pour afficher longlet Basic settings de sa vue Component.

Dans le champ File Name, dfinissez un fichier CSV dans lequel les flux de donnes mapps seront envoys. Dans cet exemple, nommez le fichier de sortie crer InputTV.csv. Ce fichier sera utilis comme fichier dentre pour le composant tLineChart. Si le nom dun fichier existant est spcifi, assurez-vous que la case Append (crire la suite) est dcoche. Laissez les autres paramtres tels quils sont. Pour ce qui est des deux autres composants tFileOutputDelimited, utilisez le mme chemin daccs que celui dfini pour le premier composant tFileOutputDelimited et cochez la case Append. Vrifiez que la case Append est coche afin que tous les flux de donnes mapps aillent dans le mme fichier, sans craser les donnes existantes. Connectez le premier composant tFileInputDelimited au second composant tFileInputDelimited laide dune connexion de type Trigger > OnSubjobOK. Connectez le second composant tFileInputDelimited au tLineChart laide dune connexion de type Row > Main. Double-cliquez sur le second composant tFileInputDelimited afin dafficher longlet Basic settings de sa vue Component.

158

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un graphique en lignes afin de faciliter lanalyse des tendances

Renseignez le champ File name avec le chemin daccs au fichier, ainsi que son nom, le mme que celui dfini dans chaque composant tFileOutputDelimited. Dans cet exemple, le fichier dentre du tLineChart est InputTV.scv. Laissez les autres paramtres tels quils sont. Le schma dentre doit correspondre la structure requise par le composant tLineChart. La structure du schma est donc copie partir du schma du tLineChart. Double-cliquez sur le composant tLineChart pour afficher longlet Basic settings de sa vue Component.

Cliquez sur Edit schema afin douvrir la bote de dialogue du schma.

Guide de Rfrence des Composants Talend Open Studio

159

Scnario : Crer un graphique en lignes afin de faciliter lanalyse des tendances

Copiez toutes les colonnes du schma de sortie dans le schma dentre en cliquant sur la double-flche pointant vers la gauche. Cliquez sur OK pour fermer la bote de dialogue du schma. Dans le champ Generated image path, dfinissez le chemin daccs du fichier image gnrer. Dans le champ Chart title, saisissez un titre pour le graphique en lignes. Dans ce scnario, son titre est Average Weekly Viewing (per person). Saisissez un nom pour les axes domain (X) et range (Y). Dans ce scnario, les noms des axes sont respectivement Week et Minutes. Dfinissez comme vous le souhaitez la taille de limage (dans les champs Image width pour la largeur et Image height pour la hauteur), la priode dans laquelle est calcule la moyenne mobile (dans le champ Period une fois la case Moving average coche), les limites infrieures et suprieures (respectivement dans les champs Lower bound et Upper bound), ainsi que la couleur de fond du graphique et du plan (respectivement dans les champs Chart background et Plot background). Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Un graphique en lignes est gnr selon les critres dfinis. Il affiche une comparaison du temps de visionnage moyen et des volutions dans le temps correspondant aux diffrentes chanes de tlvision.

160

Guide de Rfrence des Composants Talend Open Studio

tMondrianInput

tMondrianInput

Proprits du tMondrianInput
Famille du composant Fonction Objectif Business Intelligence/OLAP Cube Le composant tMondrianInput lit des donnes partir de bases relationnelles et produit des groupes de donnes multidimensionnels reposant sur une requte MDX. Le tMondrianInput excute une expression multi-dimensionnelle (MDX) correspondant la structure du groupe de donnes et au schma dfini. Puis il passe les donnes multidimensionnelles obtenues au composant suivant laide dun lien de type Row Main. Mondrian Version DB type Property type Slectionnez la version de Mondrian que vous utilisez. Slectionnez le type de relation appropri pour relier les bases de donnes. Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Datasource Chemin daccs et nom du fichier contenant les donnes. Username et Password Informations dauthentification de lutilisateur de la base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : le Guide Utilisateur de Talend Open Studio. Catalog MDX Query Chemin daccs au catalogue (structure de lentrept de donnes). Saisissez votre requte MDX en faisant attention ce que lordre des champs corresponde celui dfini dans le schma et dans la structure de lentrept de donnes. Slectionnez le type dencodage partir de la liste ou choisissez loption Custom pour le dfinir manuellement. Ce champ doit obligatoirement tre renseign. Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Encoding

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant couvre toutes les possibilits des requtes MDX pour des groupes de donnes multidimensionnels.

Guide de Rfrence des Composants Talend Open Studio

161

Scnario : Tables en jointure croise

Scnario : Tables en jointure croise


Le prsent Job permet dextraire des groupes de donnes multidimensionnels partir de tables de bases de donnes relationnelles stockes dans une base MySQL. Les donnes sont rcupres laide dune expression multidimensionnelle (requte MDX). Il est clair que vous devez connatre la structure de vos donnes, ou du moins disposer dune description de la structure (catalogue) comme rfrence du groupe de donnes rcuprer dans ces diffrentes dimensions.

A partir de la Palette, cliquez-dposez un composant tMondrianInput (famille Business Intelligence) ainsi quun composant de sortie tLogRow (famille Logs & Errors). Reliez le tMondrianInput au composant de sortie laide dun lien de type Row Main. Slectionnez le composant tMondrianInput puis cliquez sur la vue Component.

Dans le champ DB Type, slectionnez la base de donnes relationnelle utiliser avec Mondrian. Slectionnez lentre du Repository correspondante dans le champ Property type, dans le cas o vous stockez les dtails de connexion vos bases de donnes de manire centralise. Dans cet exemple, les proprits sont en mode Built-in. Remplissez les dtails de connexion votre base de donnes : Host, Port, Database, User Name et Password. Dans le champ Schema, slectionnez le schma correspondant partir du Repository dans le cas o il est stock de manire centralise. Dans cet exemple, le schma doit reste dfinir (mode Built-in).

162

Guide de Rfrence des Composants Talend Open Studio

Scnario : Tables en jointure croise

La base de donnes relationnelle que lon veut interroger contient cinq colonnes : media, drink, unit_sales, store_cost et store_sales. La requte doit permettre de rcuprer le contenu de unit_sales, store_cost et de store_sales pour les diffrentes valeur de media / drink en utilisant une requte MDX comme dans lexemple ci-dessous :

A partir de longlet Basic settings du composant tMondrianInput, renseignez le chemin daccs au catalogue de lentrept de donnes dans le champ Catalog. Ce catalogue dcrit la structure de lentrept. Entrez ensuite la requte MDX de la manire suivante : "select {[Measures].[Unit Sales], [Measures].[Store Cost], [Measures].[Store Sales]} on columns, CrossJoin( { [Promotion Media].[All Media].[Radio], [Promotion Media].[All Media].[TV],

Guide de Rfrence des Composants Talend Open Studio

163

Scnario : Tables en jointure croise

[Promotion Media].[All Media].[Sunday Paper], [Promotion Media].[All Media].[Street Handout] }, [Product].[All Products].[Drink].children) on rows from Sales where ([Time].[1997])" Slectionnez enfin le type dencodage partir de la liste du champ Encoding Type. Slectionnez le composant tLogRow puis cochez loption Print header pour afficher le nom des colonnes sur la console. Enregistrez le Job puis appuyez sur F6 pour lexcuter.

La console affiche le rsultat de unit_sales, store_cost et store_sales pour chaque type de Drink (Beverages, Dairy, Alcoholic beverages) crois avec chaque type de media (TV, Sunday Paper, Street handout) comme illustr cidessus.

164

Guide de Rfrence des Composants Talend Open Studio

tMSSqlSCD

tMSSqlSCD

Proprits du tMSSqlSCD
Famille de composant Databases/Business Intelligence/MSSQL Server Le composant tMSSqlSCD reflte et traque les modifications dune table SCD MSSQL ddie. Le tMSSqlSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Server Port Schema Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom du schma de la base de donnes. Nom de la base de donnes.

Fonction Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

165

Scnario associ

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de constuire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations concernant les mthodes de cration, consultez la section intitule Cls SCD . Use memory Mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. tStatCatcher Statistics Debug mode Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

166

Guide de Rfrence des Composants Talend Open Studio

tMysqlSCD

tMysqlSCD

Proprits du tMysqlSCD
Famille de composant Fonction Objectif Databases/Business Intelligence/MySQL Le composant tMysqlSCD reflte et traque les modifications dune table SCD MySQL ddie. Le tMysqlSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. DB Version Host Port Database Slectionnez la version de Mysql que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

167

Proprits du tMysqlSCD

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist: :crer la table si ncessaire. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. SCD Editor Lditeur SCD Editor permet de construire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur.

Advanced settings

Additional JDBC Para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. tStatCatcher Statistics Debug mode Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row > Main en entre.

Mthodologie de gestion du SCD


Lors de dimensions volution lente ou Slowly Changing Dimensions (SCD), les donnes changent lentement. Lditeur SCD permet de construire de manire simple le flux de sortie des donnes SCD. Dans lditeur SCD, vous pouvez relier les colonnes, slectionner la cl de substitution (Surrogate key) et paramtrer les attributs des colonnes modifies en combinant les diffrents types de modifications SCD. La figure ci-dessous reprsente lditeur SCD.

168

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMysqlSCD

Cls SCD
Vous devez slectionner une ou plusieurs colonnes qui serviront de cls permettant dassurer lunicit des donnes entrantes. Vous devez aussi slectionner une colonne sur laquelle positionner une cl de substitution (surrogate key) dans la table SCD et la relier une des colonnes dentre de la table source. La valeur de la cl de substitution permet de relier les enregistrements de la table source aux enregistrements de la table SCD. Lditeur utilise ce mapping pour localiser lenregistrement dans la table SCD et pour dterminer si un enregistrement est nouveau ou sil a t modifi. La cl de substitution est gnralement la cl primaire de la table source, mais elle peut aussi correspondre une autre cl partir du moment o elle permet didentifier de faon unique un enregistrement et o ses valeurs ne changent pas. Source keys : Glissez une ou plusieurs colonnes du panneau Unused vers le panneau Source keys. Ces colonnes seront utilises en tant que cl(s) assurant lunicit des donnes entrantes. Surrogate keys : Paramtrez la colonne dans laquelle la cl de substitution gnre sera stocke. Une cl de substitution peut tre gnre en fonction de la mthode slectionne dans la liste Creation. Creation : Slectionnez une des mthodes suivantes permettant de gnrer la cl : Auto increment : la cl est auto-incrmente. Input field : la cl est fournie par un champ dentre.

Guide de Rfrence des Composants Talend Open Studio

169

Proprits du tMysqlSCD

Lorsque cette mthode est slectionne, vous pouvez glisser le champ correspondant du panneau Unused vers le champ complement. Routine : partir du champ complement, vous pouvez appuyer sur Ctrl+ Espace afin dafficher la liste dautocompltion et de slectionner la routine approprie. Table max +1 : la valeur maximum de la table SCD est incrmente pour crer une cl de substitution. DB Sequence : partir du champ complement, vous pouvez saisir le nom de la squence de la base de donnes (DB Sequence) existante qui va incrmenter automatiquement la colonne indique dans le champ name. Loption DB Sequence est disponible uniquement depuis lditeur SCD du composant tOracleSCD.

Types de SCD
Il existe quatre types de dimensions volution lente (Slowly Changing Dimensions) : du Type 0 au Type 3. Vous pouvez, dun simple glisser-dposer, appliquer nimporte quel type de SCD nimporte quelle colonne de la table source. Type 0 : ce type de SCD nest pas beaucoup utilis. Certaines donnes dimensionnelles peuvent tre crases et dautres peuvent rester inchanges au cours du temps. Ce type de SCD convient lorsque aucun effort na t mis en place pour grer les dimensions caractre volutif. Type 1 : aucun historique nest stock dans la base de donnes. Les nouvelles donnes crase les anciennes. Utilisez ce type si vous navez pas besoin de traquer les changements. Ce type de SCD convient lorsque vous corrigez certaines fautes, par exemple lorthographe des mots. Type2 : lintgralit de lhistorique est stocke dans la base de donnes. Ce type de SCD traque les donnes dhistorique en enregistrant un nouvel enregistrement dans la table de dimension avec une nouvelle cl chaque fois quun changement est effectu. Ce type de SCD convient lorsque lon traque les mises jour, par exemple. Le principe du SCD Type 2 rside dans le fait quun nouvel enregistrement est ajout la table SCD lorsquun changement est dtect dans les colonnes slectionnes. Notez que bien que plusieurs changements peuvent tre effectus au mme enregistrement sur plusieurs colonnes paramtres en Type 2, une seule ligne traquant ces changements est ajoute la table SCD. Le schma du SCD Type 2 devrait inclure des colonnes spcifiques au SCD contenant les informations de log standard, notamment : -start : ajoute une colonne au schma de la table SCD contenant la date de dbut dun enregistrement. Vous pouvez slectionner une des colonnes du schma dentre comme date de dpart pour la table SCD. -end : ajoute une colonne au schma de la table SCD contenant la date de fin dun enregistrement. Lorsque lenregistrement est en cours, la date de fin est de valeur NULL , sinon vous pouvez utiliser une anne fixe en slectionnant Fixed Year Value dans la liste et renseignez lanne fictive dans la cellule d cot pour viter davoir une valeur nulle dans le champ end. -version : ajoute une colonne au schma de la table SCD contenant le numro de version de lenregistrement. -active : ajoute une colonne au schma de la table SCD contenant les statuts true ou false. Cette colonne permet de reprer facilement les enregistrements actifs. Type 3 : seules les informations sur lancienne valeur dune dimension est crite dans la base de donnes. Ce type de SCD traque les changements en utilisant des colonnes spares. Ce type de SCD convient lorsque lon traque les valeurs prcdentes dune colonne qui change.

170

Guide de Rfrence des Composants Talend Open Studio

Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3

Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3
Ce scnario dcrit un Job traquant les modifications effectues dans quatre des colonnes du fichier dlimit source, crit ces modifications ainsi que lhistorique des modifications dans une table SCD et affiche les informations derreurs dans la console Run. Le fichier dlimit source contient diffrentes informations personnelles : des prnoms dans la colonne firstname, des noms dans la colonne lastname, des adresses dans la colonne address, des villes dans la colonne city, lentreprise de la personne dans la colonne company, son ge dans la colonne age et son statut marital dans la colonne status. Une colonne id permet dassurer lunicit des donnes.

Les changements de statut marital doivent craser les anciens statuts enregistrs. Ce type de changement correspond un changement SCD Type 1. Un nouvel enregistrement dans la table dimensionnelle avec une cl diffrente sera insr chaque fois quune personne change dentreprise. Ce type de changement correspond un changement SCD Type 2. Vous allez rcuprer lancienne ville et lancienne adresse dune personne. Ce type de changement correspond un changement SCD Type 3. Pour raliser ce type de scnario, il est prfrable de le sparer en trois tapes principales : la dfinition du flux principal du Job, le paramtrage de lditeur SCD et la cration de la table de modification dans la base de donnes. Etape 1 : Dfinir le flux principal du Job Cliquez et dposez les composants suivants dans lditeur graphique : tMysqlConnection, tFileInputDelimited, tMysqlSCD, tMysqlCommit ainsi que deux composants tLogRow. Connectez les composants tFileInputDelimited, le premier tLogRow et le tMysqlSCD laide dun lien Row Main. Ce sous-job correspond au flux principal du Job. Connectez le tMysqlConnection au tFileInputDelimited et le tMysqlSCD au tMysqlCommit laide de liens OnComponentOk. Connectez le tMysqlSCD au second tLogRow laide dun lien Row Reject. Les colonnes errorCode et errorMessage sont ajoutes au schma. Cette connexion collecte les informations derreurs.

Guide de Rfrence des Composants Talend Open Studio

171

Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3

Dans lditeur graphique, double-cliquez sur le composant tMysqlConnection pour afficher ses proprits de base dans longlet Basic settings et renseigner manuellement les informations de connexion. Lorsque plusieurs composants Database sont utiliss, le composant tMysqlConnection devrait tre utilis pour viter de renseigner plusieurs fois les mmes informations de connexion la base de donnes. Si vous avez dj stock les informations de connexion dans le Repository, glissez llment Metadata souhait dans lditeur graphique et les informations de connexion la base de donnes apparatront automatiquement dans les champs correspondants. Pour plus dinformations sur les mtadonnes, consultez le Guide utilisateur de Talend Open Studio. Dans ce scnario, lobjectif est de se connecter la table SCD dans laquelle toutes les modifications apportes au fichier dlimit seront traques.

Dans lditeur graphique, double-cliquez sur le composant tFileInputDelimited pour afficher la vue Basic settings.

172

Guide de Rfrence des Composants Talend Open Studio

Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3

Cliquez sur le bouton [...] ct du champ File Name pour slectionner le chemin daccs au fichier dlimit dataset.csv source contenant les informations personnelles. Dans les champs Row et Field Separator, renseignez respectivement les sparateurs de lignes et de champs utiliss dans le fichier source. Les champs File Name, Row separator et Field separators sont obligatoires. Si ncessaire, renseignez les champs Header, Footer et Limit. Dans ce scnario, saisissez 1 dans le champ Header puisque le fichier source contient un en-tte. Laissez le champ Footer 0 puisque le fichier source ne contient pas de pied de page et ne renseignez pas le champ Limit dterminant le nombre de lignes devant tre traites. Cliquez sur Edit schema pour dcrire la structure des donnes du fichier dlimit source. Dans ce scnario, le schma source est compos de huit colonnes : id,firstname, lastname, address, city, company, age et status.

Dans longlet Basic settings du premier composant tLogRow, slectionnez le mode Table afin que le contenu du fichier source, ainsi que les attributs variants apparaissent dans les cellules du tableau dans la console avant dtre traites par composant SCD. Dans lditeur graphique, double-cliquez sur le composant tMysqlSCD pour paramtrer ses proprits.

Dans longlet Basic settings, cochez la case Use an existing connection pour rutiliser les informations de connexion dfinies dans les proprits du composant tMysqlConnection.

Guide de Rfrence des Composants Talend Open Studio

173

Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3

Dans le champ Table, saisissez le nom de la table SCD dans laquelle les changements seront stocks. Si ncessaire, cliquez sur Sync columns pour rcuprer toutes les colonnes du fichier dlimit. Dans lditeur graphique, double-cliquez sur le composant tMysqlCommit pour paramtrer ses proprits. Dans la liste Component list, slectionnez la connexion adquate sil y a plusieurs composants de connexion dans le Job. Dans longlet Basic settings du second composant tLogRow, slectionnez le mode Table afin que le contenu du fichier source, ainsi que les attributs variants apparaissent dans les cellules dun tableau. Etape 2 : Paramtrer lditeur SCD Dans longlet Basic settings du composant tMysqlSCD, cliquez sur le bouton [...] ct du champ SCD Editor pour ouvrir lditeur SCD editor et construire le flux de donnes en sortie du SCD.

Toutes les colonnes du fichier dlimit source, provenant du composant prcdent et nayant pas encore t utilises, apparaissent dans le panneau Unused de lditeur SCD. Tous les autres panneaux de lditeur sont vides. A partir de la liste Unused, glissez la colonne id vers le panneau Source keys pour tre utilise comme cl permettant dassurer lunicit des donnes entrantes. Dans le panneau Surrogate keys, donnez un nom la cl de substitution (surrogate key) dans le champ Name, SK1 pour ce scnario. Dans la liste Creation, slectionnez la mthode utiliser pour gnrer la cl de substitution, Auto-increment pour ce scnario. Dans la liste Unused, glissez les colonnes firstname et lastname vers le panneau Type 0, les changements effectus dans ces colonnes ne sont pas pertinents dans cet exemple. Glissez la colonne status vers le panneau Type 1. Lancienne valeur sera crase par la nouvelle. Glissez la colonne company vers le panneau Type 2. A chaque fois quune personne change dentreprise, un nouvel enregistrement sera insr dans la table dimensionnelle avec une nouvelle cl. Dans la zone Versioning : -Paramtrez les colonnes start et end de votre table SCD contenant respectivement les dates de dbut et de fin. La date de fin est nulle pour les enregistrements en cours jusqu ce quun changement soit dtect. A ce moment l, la date de fin est renseigne et un nouvel enregistrement est ajout sans date de fin. 174 Guide de Rfrence des Composants Talend Open Studio

Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3

Dans ce scnario, slectionnez Fixed Year Value dans la colonne end et saisissez une anne fictive pour viter davoir une valeur nulle dans le champ de date de fin. -cochez le case version pour conserver le numro de version de lenregistrement. -cochez la case active pour ajouter la colonne Status contenant les statuts True ou False des enregistrements. True correspond lenregistrement en cours et False correspond lenregistrement modifi. Glissez les colonnes address et city vers le panneau Type 3 pour ne rcuprer que les informations sur les anciennes valeurs des adresses et des villes. Pour plus dinformations sur les types de SCD, consultez la section intitule Mthodologie de gestion du SCD

Cliquez sur OK pour valider votre configuration et fermer lditeur SCD. Cliquez sur Edit schema pour afficher le flux de donnes en entre et en sortie. Le schma de sortie du SCD devrait inclure les colonnes spcifiques au SCD contenant les informations de log standard dfinies dans lditeur SCD editor.

Guide de Rfrence des Composants Talend Open Studio

175

Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3

Si vous modifiez la dfinition du schma dentre, vous devez vrifier et reconfigurer si ncessaire la dfinition du flux de sortie dans lditeur SCD, afin de sassurer que la structure des donnes de sortie est correctement actualise. Etape 3 : Crer la table SCD Double-cliquez sur le composant tMysqlSCD pour afficher sa vue Basic settings et slectionnez Create table if not exists partir de la liste Action on table pour viter davoir crer et dfinir manuellement la table SCD. Enregistrez votre Job et appuyez sur F6 pour lexcuter. La console Run affiche le contenu du fichier dlimit dentre et votre table SCD est cre dans votre base de donnes, contenant lensemble de donnes initial.

Janet divorce, dmnage Adelanto au 355 Golf Rd et travaille maintenant chez Greenwood. Adam sest mari, a dmnag Belmont au 2505 Alisson ct. et travaille chez Scoop. Martin travaille dsormais chez Phillips and Brothers.

176

Guide de Rfrence des Composants Talend Open Studio

Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3

Mettez jour le fichier dlimit avec ces informations et appuyez sur F6 pour excuter le Job. La console affiche les changements apports aux informations personnelles et la table SCD affiche lhistorique des changements valides, ainsi que leur statut et leur numro de version. Le nom de lentreprise de Martin dpasse la longueur dfinie pour la colonne company dans le schma. Ce changement est donc dirig vers le flux de rejets, et non sauvegard dans la table SCD.

Guide de Rfrence des Composants Talend Open Studio

177

tMysqlSCDELT

tMysqlSCDELT

Proprits du tMysqlSCDELT
Famille du composant Fonction Objectif Databases/Business Intelligence/MySQL Le composant tMysqlSCDELT reflte et traque les modifications dune table MySQL SCD ddie. Le tMysqlSCDELT adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table MySQL SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Slectionnez la version de Mysql que vous utilisez. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMysqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes.

178

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMysqlSCDELT

Source table Table Action on table

Nom de la table contenant les donnes filtrer. Nom de la table crire. Notez quune seule table peut tre crire la fois pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Source Keys Use SCD Type 1 fields Slectionnez une colonne ou plus utiliser en tant que cl(s) pour assurer lunicit des donnes entrantes. Utilisez le type 1 si vous navez pas besoin de traquer les modifications, pour des corrections typographiques par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Utilisez le type 2 si vous avez besoin de traquer les modifications, pour garder une trace des mises jour effectues par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Start date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de dpart. Vous pouvez slectionner lune des colonnes dentre du schma comme date de dpart (Start Date) dans la table SCD. End Date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de fin pour le journal. Lorsque le journal est en mode actif, la colonne End Date a une valeur nulle ; pour viter cela, vous pouvez slectionner loption Fixed Year value et saisir une anne fictive.

Use SCD Type 2 fields

Guide de Rfrence des Composants Talend Open Studio

179

Scnario associ

Log Active Status : Ajoute une colonne votre schma SCD pour renseigner les valeurs de statut true et false. Cette colonne permet de reprer facilement le journal actif. Log versions : Ajoute une colonne votre schma SCD pour renseigner le numro de version du journal. Advanced settings Debug mode tStatCatcher Statistics Utilisation Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie et une connexion de type Row Main.

Scnario associ
Pour un scnario associ, consultez la section intitule tMysqlSCD , ainsi que la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

180

Guide de Rfrence des Composants Talend Open Studio

tOracleSCD

tOracleSCD

Proprits du tOracleSCD
Famille de composant Fonction Objectif Databases/Business Intelligence/Oracle Le composant tOracleSCD reflte et traque les modifications dune table SCD Oracle ddie. Le tOracleSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection type DB Version Host Port Liste droulante des pilotes disponibles. Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

181

Scnario associ

Database Schema

Nom de la base de donnes. Nom du schma de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Create a table : crer une nouvelle table. Create table if not exists: :si ncessaire, crer une table qui nexiste pas encore. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de construire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et dignorer les lignes en erreur.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. tStatCatcher Statistics Debug mode Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

182

Guide de Rfrence des Composants Talend Open Studio

tOracleSCDELT

tOracleSCDELT

Proprits du tOracleSCDELT
Famille du composant Fonction Objectif Databases/Business Intelligence/Oracle Le composant tOracleSCDELT reflte et traque les modifications dune table Oracle SCD ddie. Le tOracleSCDELT adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table Oracle SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tOtion racleConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection type DB Version Host Port Database Liste droulante des pilotes disponibles. Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

183

Proprits du tOracleSCDELT

Username et Password Informations dauthentification de lutilisateur de base de donnes. Source table Table Action on table Nom de la table contenant les donnes filtrer. Nom de la table crire. Notez quune seule table peut tre crire la fois pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Surrogate Key Creation Slectionnez dans la liste une colonne utiliser comme cl de substitution. Slectionnez la mthode utiliser pour gnrer la cl de substitution. Pour plus dinformations concernant les mthodes de cration, consultez la section intitule Cls SCD . Source Keys Use SCD Type 1 fields Slectionnez une colonne ou plus utiliser en tant que cl(s) pour assurer lunicit des donnes entrantes. Utilisez le type 1 si vous navez pas besoin de traquer les modifications, pour des corrections typographiques par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Utilisez le type 2 si vous avez besoin de traquer les modifications, pour garder une trace des mises jour effectues par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Start date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de dpart. Vous pouvez s-

Use SCD Type 2 fields

184

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

lectionner lune des colonnes dentre du schma comme date de dpart (Start Date) dans la table SCD. End Date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de fin pour le journal. Lorsque le journal est en mode actif, la colonne End Date a une valeur nulle ; pour viter cela, vous pouvez slectionner loption Fixed Year value et saisir une anne fictive. Log Active Status : Ajoute une colonne votre schma SCD pour renseigner les valeurs de statut true et false . Cette colonne permet de reprer facilement le journal actif. Log versions : Ajoute une colonne votre schma SCD pour renseigner le numro de version du journal. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. Debug mode Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

tStat Catcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Utilisation Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie et une connexion de type Row Main.

Scnario associ
Pour un scnario associ, consultez la section intitule tOracleSCD , ainsi que la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

Guide de Rfrence des Composants Talend Open Studio

185

tPaloCheckElements

tPaloCheckElements

Proprits du tPaloCheckElements
Famille de composant Fonction Objectif Business Intelligence/Cube OLAP/Palo Le composant tPaloCheckElements vrifie lexistence dlments du flux de donnes dentre dans un cube donn. Ce composant peut tre utilis avec le tPaloOutputMulti. Il vrifie si les lments du flux dentre existent dans le cube donn, avant de les crire. Il peut galement dfinir une valeur par dfaut qui peut tre utilise si les lments nexistent pas. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante Server Port Database Cube Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle crire les donnes. Saisissez le nom du cube dans lequel les donnes doivent tre crites. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

Basic settings

186

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPaloCheckElements

On element error

Slectionnez laction effectuer lorsquun lment nexiste pas. - Reject row : la ligne correspondante sera rejete et place dans le flux de rejet. - Use default : la valeur par dfaut dfinie sera utilise. - Stop : le processus complet sera interrompu.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur Talend Open Studio. Un tableau vous permet de dfinir les lments vrifier. - Column : affiche la (les) colonne(s) du schma dentre. Cette colonne est automatiquement remplie une fois quun schma dentre est saisi ou cr. - Element type : slectionnez le type dlment de la colonne dentre. Seule une colonne peut tre dfinie en tant que Measure. - Default : saisissez la valeur par dfaut qui sera utilise si loption Use default a t slectionne dans le champ On element error . Advanced settings Utilisation Connections tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Liens de sortie (dun composant un autre) : Row : Main, Rejects Trigger : Run if, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Main, Rejects Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio. Limitation Ce composant fonctionne uniquement avec des cubes Palo de type Normal.

Ce composant requiert un composant dentre.

Guide de Rfrence des Composants Talend Open Studio

187

Scnario associ

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario 2 : Refuser un flux de donnes dentre lorsque les lments crire nexistent pas dans un cube donn .

188

Guide de Rfrence des Composants Talend Open Studio

tPaloConnection

tPaloConnection

Proprits du tPaloConnection
Famille de composant Fonction Business Intelligence/Cube OLAP/Palo Le composant tPaloConnection ouvre une connexion vers un serveur Palo et la laisse ouverte durant le temps de traitement. Chaque autre composant Palo du processus peut utiliser cette connexion. Ce composant permet le partage dune connexion un serveur Palo durant le processus complet. Host Name Server Port Advanced settings Utilisation Connections tStatCatcher Statistics Saisissez le nom de lhte ou ladresse IP du serveur hte. Saisissez le numro du port dcoute du serveur Palo. Cochez cette case pour collecter les donnes de log au niveau du composant.

Objectif Basic settings

Username et Password Informations dauthentification de lutilisateur de Palo.

Ce composant est utilis avec les composants Palo afin de partager une connexion un serveur Palo. Liens de sortie (dun composant un autre) : Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

Limitation

n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Crer une dimension avec des lments .

Guide de Rfrence des Composants Talend Open Studio

189

tPaloCube

tPaloCube

Proprits du tPaloCube
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloCube cre, supprime ou vide des cubes Palo partir de dimensions existantes dans une base de donnes Palo. Ce composant effectue des oprations sur un cube Palo donn. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Cube Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle lopration donne doit seffectuer. Saisissez le nom du cube dans lequel lopration donne doit seffectuer. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

190

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPaloCube

Cube type

Slectionnez le type de cube dans la liste droulante pour le cube sur lequel lopration donne doit seffectuer : - Normal : Type de cube normal, type par dfaut. - Attribut : un cube Attribute sera cr avec la cration dun cube normal. - User Info : un cube User Info sera cr/modifi par ce composant.

Action on cube

Slectionnez lopration que vous souhaitez effectuer sur le cube dfini : - Create cube : le cube nexiste pas et sera cr. - Create cube if not exists : cre un cube sil nexiste pas. - Delete cube if exists and create : supprime un cube sil existe et en cre un nouveau. - Delete cube : supprime le cube de la base de donnes. - Clear cube : supprime les donnes du cube.

Dimension list

Ajoutez des lignes en cliquant sur le bouton [+] et dans chaque ligne, saisissez le nom dune dimension existant dans la base de donnes et devant tre utilise dans le cube. Lordre de cette liste dfinit galement lordre de cration des dimensions. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Global Variables

tStatCatcher Statistics

Ce composant peut tre utilis en standalone dans la cration dynamique de cubes, avec une liste dfinie de dimensions. Cubename : Indique le nom du cube trait. Disponible en tant que variable After. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

Limitation

Le cube crant un processus ne cre pas les dimensions partir de rien. Les dimensions utilises dans le cube ont t cres prcdemment.

Guide de Rfrence des Composants Talend Open Studio

191

Scnario : Crer un cube dans une base de donnes existante

Scnario : Crer un cube dans une base de donnes existante


Le Job de ce scnario cre un nouveau cube deux dimensions dans la base de donnes dmo Biker de Palo.

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloCube de la Palette dans lespace de modlisation graphique. Double-cliquez sur le composant tPaloCube afin douvrir sa vue Component.

Dans le champ Host name, saisissez le nom de lhte ou ladresse IP du serveur hte, localhost dans cet exemple. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin. Dans le champ Database, saisissez le nom de la base de donnes dans laquelle vous souhaitez crer le cube, Biker dans cet exemple. Dans le champ Cube, saisissez le nom que vous souhaitez utiliser afin de crer le cube, bikerTalend, par exemple.

192

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un cube dans une base de donnes existante

Dans le champ Cube type, slectionnez le type Normal dans la liste droulante pour le cube crer, ce qui signifie que ce cube sera de type Normal, le type par dfaut. Dans le champ Action on cube, slectionnez laction effectuer. Dans ce scnario, slectionnez Create cube. Sous le tableau Dimensionlist, cliquez deux fois sur le bouton [+] afin dajouter deux lignes. Dans le tableau Dimensionlist, saisissez le nom de chaque nouvelle ligne afin de remplacer le nom par dfaut. Dans ce scnario, saisissez Months pour la premire ligne et Products pour la seconde. Ces deux dimensions existent dj dans la base de donnes Biker dans laquelle le nouveau cube sera cr. Appuyez sur F6 afin dexcuter le Job. Un nouveau cube a t cr dans la base de donnes Biker et les deux dimensions sont ajoutes dans ce cube.

Guide de Rfrence des Composants Talend Open Studio

193

tPaloCubeList

tPaloCubeList

Proprits du tPaloCubeList
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloCubeList rcupre les informations dune liste de cubes dans la base de donnes Palo dtermine. Ce composant liste le nom des cubes, leur types, le nombre de dimensions assignes, le nombre de cellules remplies dans la base de donnes dtermine. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Advanced settings tStatCatcher Statistics Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes contenant les cubes dont vous souhaitez rcuprer les informations. Cochez cette case pour collecter les donnes de log au niveau du composant. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

194

Guide de Rfrence des Composants Talend Open Studio

Dcouvrir le schma de sortie en lecture seule du tPaloCubeList

Utilisation Global Variables

Ce composant peut tre utilis en tant que composant de dbut. Il requiert un composant de sortie. Number of cubes : indique le nombre de cubes traits dans la base de donnes dtermine. Disponible en tant que variable After. Retourne un entier. Cube_ID : indique les IDs des cubes traits dans la base de donnes dtermine. Disponible en tant que variable Flow. Retourne un entier. Cubename : indique le nom des cubes traits dans la base de donnes dtermine. Disponible en tant que variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

Limitation

Le schma de sortie est fixe et en lecture seule.

Dcouvrir le schma de sortie en lecture seule du tPaloCubeList


Le tableau ci-dessous prsente les informations relatives au schma en lecture seule du composant tPaloCubeList. Colonne Cube_id Cube_name Cube_dimensions Cube_cells Cube_filled_cells Cube_status Type int string int long long int Description ID interne du cube. Nom du cube. Nombre de dimensions dans le cube. Nombre de cellules lintrieur du cube. Nombre de cellules remplies dans le cube. Statut du cube. Il peut tre :

Guide de Rfrence des Composants Talend Open Studio

195

Scnario : Rcuprer des informations dtailles dun cube dune base de donnes dtermine

Colonne

Type

Description - 0 : non charg - 1 : charg - 2 : chang

Cube_type

int

Type du cube. Il peut tre : - 0 : normal - 1 : system - 2 : attribute - 3 : user info - 4 . gpu type

Scnario : Rcuprer des informations dtailles dun cube dune base de donnes dtermine
Le Job dans ce scnario rcupre des informations dtailles concernant les cubes de la base de donnes dmo de Palo Biker.

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloCubeList et un tLogRow de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le tPaloCubeList afin douvrir son menu contextuel. Dans ce menu, slectionnez Row > Main pour relier les deux composants. Double-cliquez sur le tPaloCube afin douvrir sa vue Component.

Dans le champ Host name, saisissez le nom de lhte ou ladresse IP du serveur hte, localhost dans cet exemple.

196

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer des informations dtailles dun cube dune base de donnes dtermine

Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin. Dans le champ Database, saisissez le nom de la base de donnes dans laquelle vous souhaitez crer le cube, Biker dans cet exemple. Appuyez sur F6 pour excuter le Job. Les informations du cube sont rcupres de la base de donnes Biker et sont affiches dans la console de la vue Run.

Pour plus dinformations concernant linterprtation des informations sur le cube, consultez la section intitule Dcouvrir le schma de sortie en lecture seule du tPaloCubeList .

Guide de Rfrence des Composants Talend Open Studio

197

tPaloDatabase

tPaloDatabase

Proprits du tPaloDatabase
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloDatabase cre, supprime ou recre des bases de donnes sur un serveur Palo donn. Ce composant gre les bases de donnes dans un serveur Palo. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Action on database Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle lopration doit seffectuer. Slectionnez lopration que vous souhaitez effectuer sur le base de donnes: Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

198

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer une base de donnes

- Create database : la base de donnes nexiste pas et sera cre. - Create database if not exists : la base est cre lorsquelle nexiste pas. - Delete database if exists and create : la base de donnes est supprime si elle existe et une nouvelle base de donnes est cre. - Delete database : la base de donnes est supprime du serveur. Advanced settings Utilisation Global Variables tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en standalone lors doprations de gestion de bases de donnes dans un serveur Palo. Databasename : Indique le nom de la base de donnes traite. Disponible en tant que variable After. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio.

Limitation

n/a

Scnario : Crer une base de donnes


Le Job de ce scnario cre une nouvelle base de donnes sur un serveur Palo donn.

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloDatabase de la Palette dans lespace de modlisation graphique. Double-cliquez sur le composant tPaloDatabase afin douvrir sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

199

Scnario : Crer une base de donnes

Dans le champ Host name, saisissez le nom de lhte ou ladresse IP du serveur hte, localhost dans cet exemple. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin. Dans le champ Database, saisissez le nom de la base de donnes dans laquelle vous souhaitez crer le cube, talenddatabase dans cet exemple. Dans le champ Action on database, slectionnez laction effectuer. Dans ce scnario, slectionnez Create database puisque la base de donnes crer nexiste pas. Appuyez sur F6 pour excuter votre Job. Une nouvelle base de donnes est cre sur le serveur Palo donn.

200

Guide de Rfrence des Composants Talend Open Studio

tPaloDatabaseList

tPaloDatabaseList

Proprits du tPaloDatabaseList
Famille de composant Fonction Objectif Business Intelligence/Cube OLAP/Palo Le composant tPaloDatabaseList rcupre les informations dune liste de bases de donnes dans un serveur Palo donn. Ce composant liste les noms des bases de donnes, leur type, le nombre de cubes, le nombre de dimensions, le statut et lID des bases de donnes dun serveur Palo donn. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Advanced settings tStatCatcher Statistics Saisissez le numro du port dcoute du serveur Palo. Cochez cette case pour collecter les donnes de log au niveau du composant. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

201

Dcouvrir le schma de sortie en lecture seule du tPaloDatabaseList

Utilisation Global Variables

Ce composant peut tre utilis en tant que composant de dbut. Il ncessite un composant de sortie. Number of databases : Indique le nombre de bases de donnes traites. Disponible en tant que variable After. Retourne un entier. Database_id : Indique lID de la base de donnes traite. Disponible en tant que variable Flow. Retourne un long. Databasename : Indique le nom de la base de donnes traite. Disponible en tant que variable After. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio.

Limitation

Le schma de sortie est fixe et en lecture seule.

Dcouvrir le schma de sortie en lecture seule du tPaloDatabaseList


Le tableau ci-dessous prsente les informations relatives au schma de sortie en lecture seule du composant tPaloDatabaseList. Base de donnes Database_id Database_name Database_dimensions Database_cubes Database_status Type long string int int int Description ID interne de la base de donnes. Nom de la base de donnes. Nombre de dimensions dans la base de donnes. Nombre de cubes dans la base du donnes. Statut de la base de donnes . - 0 = non charge - 1 = charge

202

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer des informations dtailles concernant les bases de donnes dun serveur Palo donn

Base de donnes Database_types

Type int

Description - 2 = change Type de la base de donnes. - 0 = normal - 1 = system - 3 = user info

Scnario : Rcuprer des informations dtailles concernant les bases de donnes dun serveur Palo donn
Le Job de ce scnario rcupre des informations concernant toutes les bases de donnes dun serveur Palo donn.

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloDatabaseList et un tLogRow de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le tPaloDatabaseList pour ouvrir le menu contextuel. Dans ce menu, slectionnez Row > Main pour relier les deux composants. Double-cliquez sur le tPaloDatabaseList pour ouvrir sa vue Component.

Dans le champ Host name, saisissez le nom de lhte ou ladresse IP du serveur hte, localhost dans cet exemple. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin.

Guide de Rfrence des Composants Talend Open Studio

203

Scnario : Rcuprer des informations dtailles concernant les bases de donnes dun serveur Palo donn

Appuyez sur F6 pour excuter le Job. Les informations de toutes les bases de donnes du serveur Palo sont rcupres et affiches dans la console de la vue Run.

Pour plus dinformations concernant le schma de sortie, consultez la section intitule Dcouvrir le schma de sortie en lecture seule du tPaloDatabaseList .

204

Guide de Rfrence des Composants Talend Open Studio

tPaloDimension

tPaloDimension

Proprits du tPaloDimension
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloDimension cre, supprime ou recre des dimensions avec ou sans lments de dimension dans une base de donnes Palo. Ce composant gre les dimensions Palo, ainsi que les lments dans une base de donnes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Dimension Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle les dimensions sont gres. Saisissez le nom de la dimension sur laquelle lopration donne doit seffectuer. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

Guide de Rfrence des Composants Talend Open Studio

205

Proprits du tPaloDimension

Action on dimension

Slectionnez lopration que vous souhaitez effecteur sur la dimension : - None : aucune action nest effectue sur la dimension. - Create dimension : la dimension nexiste pas et sera cre. - Create dimension if not exists : cette dimension est cre quand elle nexiste pas. - Delete dimension if exists and create : cette dimension est supprime si elle existe et une nouvelle dimension est cre. - Delete dimension : la dimension est supprime de la base de donnes.

Create dimension ele- Cochez cette case pour activer les champs de gestion des ments dimensions et crer des lments de dimension , et crer cette dimension. Les champs ci-des- Dimension type sous sont disponibles uniquement quand la case Create dimenDisponible unision elements est coquement che. lorsque laction effectuer sur la dimension est None. Commit size Slectionnez le type de dimension crer. Le type peut tre : - Normal - User info - System - Attribute Saisissez le nombre dlments qui seront crs avant de les sauvegarder dans la dimension.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur Talend Open Studio. Consolidation None - Slectionnez ce bouton pour dplacer directement les lments entrants dans la dimension donne. Avec cette option, vous ne dfinissez aucune consolidation ou hiCette option ac- rarchie. tive les champs des paramtres correspondants devant tre renseigns. Input Column : slectionnez une colonne dans la liste droulante. Les colonnes de la liste droulante sont celles que vous avez dfinies dans le schma. Les valeurs de la colonne slectionne seront prises en compte lors du traitement dlments de dimension. type

206

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPaloDimension

Element type : Slectionnez le type dlments. Il peut tre : - Numeric - Text Creation mode : Slectionnez le mode de cration pour les lments traiter. Ce mode peut tre : - Add : ajoute simplement un lment la dimension. - Force add : force la cration de cet lment. Sil existe, llment sera recr. - Update : met jour llment sil existe. - Add or Update : si llment nexiste pas, il sera cr. Sil existe, il sera mis jour. Cette option est loption par dfaut. - Delete : supprime cet lment de la dimension. Consolidation Normal - Slectionnez ce bouton pour crer des lments et les consolider dans la dimension donne. Cette consolidation structure les lments crs diffrents niveaux. Cette option active les champs des paramtres correspondants devant tre renseigns. Input Column: slectionnez une colonne dans la liste droulante. Les colonnes de la liste droulante sont celles que vous avez dfinies dans le schma. Les valeurs de la colonne slectionne seront prises en compte lors du traitement dlments de dimension. Element type : Slectionnez le type dlments. Il peut tre : - Numeric - Text Creation mode : Slectionnez le mode de cration pour les lments crer. Ce mode peut tre : - Add : ajoute simplement un lment la dimension. - Force add : force la cration de cet lment. Sil existe, llment sera recr. - Update : met jour llment sil existe. - Add or Update : si llment nexiste pas, il sera cr. Sil existe, il sera mis jour. Cette option est loption par dfaut. Consolidation type Self-referenced - Slectionnez ce bouton pour crer des lments et les structurer partir dune relation parent-enfant. Le flux dentre est responsable du regroupement de la consolidation. type

Guide de Rfrence des Composants Talend Open Studio

207

Proprits du tPaloDimension

Cette option active les champs des paramtres correspondants devant tre renseigns. Elements type Slectionnez le type dlments. Il peut tre : - Numeric - Text Creation mode Slectionnez le mode de cration pour les lments crer. Ce mode peut tre : - Add : ajoute simplement un lment la dimension. - Force add : force la cration de cet lment. Sil existe, llment sera recr. - Update : met jour llment sil existe. - Add or Update : si llment nexiste pas, il sera cr. Sil existe, il sera mis jour. Cette option est loption par dfaut. Input Column : slectionnez une colonne dans la liste droulante. Les colonnes dans cette liste sont celles que vous avez dfinies dans le schma. Les valeurs de la colonne slectionne seront prises en compte lors du traitement dlments de dimension. Hierarchy Element : slectionnez le type et la relation de cette colonne dentre pour la consolidation. - Parent : dfinissez la valeur dentre en tant qulment parent. - Child : lie la valeur dentre la valeur parent et construit la consolidation. - Factor : dfinissez le facteur de cette consolidation. Advanced settings Utilisation Global Variables tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en standalone ou comme composant de fin dun processus. Dimensionname : Indique le nom de la dimension traite. Disponible en tant que variable After . Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error.

208

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer une dimension avec des lments

Liens dentre (dun composant un autre) : Row : Main, Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio. Limitation La suppression dlments de dimension est possible uniquement avec le type de consolidation None. Seul le type de consolidation Self-Referenced permet le placement dun facteur dans cette consolidation.

Scnario : Crer une dimension avec des lments


Le Job de ce scnario cre une dimension de date avec une hirarchie dlments simple, compose de trois niveaux : Year, Month, Date (Anne, mois, date).

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloConnection, un tRowGenerator, un tMap, et un tPaloDimension de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le tPaloConnection afin douvrir le menu contextuel. Dans le menu, slectionnez Trigger > On Subjob Ok pour le relier au tRowGenerator. Cliquez-droit sur le tRowGenerator afin douvrir le menu contextuel. Le tRowGenerator est utilis pour gnrer des lignes au hasard afin de simplifier ce processus. Dans un cas rel dutilisation, vous pouvez utiliser un autre composant dentre afin de charger vos donnes. Dans le menu, slectionnez Row > Main pour le relier au tMap. Cliquez-droit sur le tMap pour ouvrir le menu contextuel. Dans le menu, slectionnez Row > *New output* pour le relier au tPaloDimension. Nommez ce lien out1 dans la bote de dialogue qui souvre. Double-cliquez sur le composant tPaloCube afin douvrir sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

209

Scnario : Crer une dimension avec des lments

Dans le champ Host name, saisissez le nom de lhte ou ladresse IP du serveur hte, localhost dans cet exemple. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez les informations dauthentification. Dans cet exemple, les deux sont admin. Double-cliquez sur le tRowGenerator pour ouvrir son diteur.

Dans la partie suprieure de lditeur, cliquez sur le bouton [+] pour ajouter une colonne, et renommez-la random_date dans la colonne Column. Dans la ligne nouvellement ajoute, slectionnez Date pour la colonne Type, et getRandomDate dans la colonne Functions. Dans la vue Function parameters de la partie infrieure de lditeur, saisissez les nouvelles valeurs des dates minimum et maximum de la colonne Value. Dans cet exemple, le minimum est 2010-01-01, le maximum est 2010-12-31. Cliquez sur OK afin de valider vos modifications et fermer lditeur. Dans la bote de dialogue qui souvre, cliquez sur OK pour propager les modifications.

210

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer une dimension avec des lments

Double-cliquez sur le tMap afin douvrir son diteur.

Dans la vue Schema editor de la partie infrieure de la fentre, sous la table out1, cliquez sur le bouton [+] afin dajouter trois lignes. Dans la colonne Column de la table out1 saisissez de nouveaux noms pour les trois lignes ajoutes, Year, Month et Date (anne, mois et date). Ces lignes sont ajoutes automatiquement la table out1 dans la partie infrieure du tMap editor. Dans la table out1 de la partie suprieure de lditeur, cliquez sur la colonne Expression de la ligne Year. Appuyez sur les touches Ctrl+Espace afin douvrir la liste dauto-compltion. Double-cliquez sur TalendDate.formatDate pour la slectionner. Lexpression pour obtenir la date saffiche dans la ligne Year. Lexpression est la suivante : TalendDate.formatDate("yyyy-MM-dd HH:mm:ss",myDate). Remplacez lexpression par dfaut par TalendDate.formatDate("yyyy",row1.random_date). Rptez lopration pour les lignes Month et Date pour ajouter lexpression par dfaut et remplacez-la respectivement par TalendDate.formatDate("MM",row1.random_date)et par TalendDate.formatDate("dd-MM-yyyy", row1.random_date). Cliquez sur OK afin de valider cette modification et acceptez la propagation des modifications en cliquant sur OK dans la bote de dialogue qui souvre. Dans lespace de modlisation graphique, double-cliquez sur le tPaloDimension afin douvrir sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

211

Scnario : Crer une dimension avec des lments

Cochez la case Use an existing connection. Le tPaloConnection_1 saffiche automatiquement dans le champ Connection configuration. Dans le champ Database, saisissez le nom de la base de donnes dans laquelle la nouvelle dimension est cre, talendDatabase dans cet exemple. Dans le champ Dimension, saisissez le nom que vous souhaitez utiliser pour la dimension crer, Date, par exemple. Dans le champ Action on dimension, slectionnez laction effectuer. Dans ce scnario, slectionnez Create dimension if not exist. Slectionnez la case Create dimension elements. Dans la zone Consolidation Type, slectionnez le bouton Normal. Sous le tableau de la hirarchie des lments, cliquez trois fois sur le bouton [+] pour ajouter trois lignes au tableau. Dans la colonne Input column du tableau, slectionnez Year dans la liste droulante de la premire ligne, Month dans la deuxime et Date dans la troisime. Cela dtermine le niveau des lments des diffrentes colonnes du schma dentre. Appuyez sur F6 pour excuter le Job. Une nouvelle dimension a t cre dans la base de donnes Palo talendDatabase.

212

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer une dimension avec des lments

Guide de Rfrence des Composants Talend Open Studio

213

tPaloDimensionList

tPaloDimensionList

Proprits du tPaloDimensionList
Famille de composant Fonction Objectif Business Intelligence/Cube OLAP/Palo Le composant tPaloDimensionList rcupre les informations dune liste de dimensions de la base de donnes Palo dtermine. Ce composant affiche le nom des dimensions, leur type, le nombre dlments de dimension, le maximum dindentation des dimensions, le maximum de profondeur des dimensions, le maximum des niveaux des dimensions, lID des dimensions dans un serveur Palo donn. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle se trouvent les dimensions qui vous intressent. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

Basic settings

214

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPaloDimensionList

Retrieve cube dimen- Cochez cette case pour rcuprer les informations des disions mensions dun cube existant. Cube Disponible lorsque vous cochez la case Retrieve cube dimensions. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. Advanced settings Utilisation Global Variables tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Saisissez le nom du cube duquel les informations concernant les dimensions sont rcupres.

Ce composant peut tre utilis en standalone ou comme composant de dbut dun processus. Dimension name : Indique le nom de la dimension traite. Disponible en tant que variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Subjob Ok; On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio.

Limitation

Le schma de sortie est fixe et en lecture seule.

Guide de Rfrence des Composants Talend Open Studio

215

Dcouvrir le schma de sortie en lecture seule du tPaloDimensionList

Dcouvrir le schma de sortie en lecture seule du tPaloDimensionList


Le tableau ci-dessous prsente les informations relatives au schma de sortie en lecture seule du composant tPaloDimensionList.

Dimension Dimension_id Dimension_name Dimension_attribute_cube Dimension_rights_cube Dimension_elements Dimension_max_level Dimension_max_indent Dimension_max_depth Dimension_type

Type long string string string int int int int int

Description ID interne de la dimension. Nom de la dimension. Nom du cube des attributs. Nom du cube des droits. Nombre dlments de dimension. Niveau maximal de la dimension. Indentation maximum de la dimension. Profondeur maximale de la dimension. Type de la dimension : - 0 = normal - 1 = system - 2 = attribute - 3 = user info

Scnario: Rcuprer des informations dtailles concernant les dimensions dune base de donnes dtermine
Le Job de ce scnario rcupre les informations de toutes les dimensions dune base de donnes dtermine.

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloDimensionList et un tLogRow de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le tPaloDimensionList pour ouvrir le menu contextuel. Dans le menu, slectionnez Row > Main pour relier les deux composants. Double-cliquez sur le composant tPaloDimensionList pour ouvrir sa vue Component.

216

Guide de Rfrence des Composants Talend Open Studio

Scnario: Rcuprer des informations dtailles concernant les dimensions dune base de donnes dtermine

Dans le champ Host name, saisissez le nom de lhte ou ladresse ID du serveur hte, localhost dans cet exemple. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin. Dans le champ Database, saisissez le nom de la base de donnes contenant les dimensions qui vous intressent, Biker dans cet exemple. Appuyez sur F6 pour excuter le Job. Les informations concernant les dimensions de la base de donnes Biker sont rcupres et affiches dans la console de la vue Run.

Pour plus dinformations concernant le schma de sortie, consultez la section intitule Dcouvrir le schma de sortie en lecture seule du tPaloDimensionList .

Guide de Rfrence des Composants Talend Open Studio

217

tPaloInputMulti

tPaloInputMulti

Proprits du tPaloInputMulti
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloInputMulti rcupre des donnes (des lments et des valeurs) dun cube Palo. Ce composant rcupre les valeurs stockes ou calcules ainsi que les enregistrements lextrieur dun cube. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Cube Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle se trouvent les lments qui vous intressent. Saisissez le nom du cube dans lequel les lments de dimension rcuprer sont stocks. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

218

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPaloInputMulti

Cube type

Slectionnez le type de cube dans la liste droulante pour le cube sur lequel lopration donne doit seffectuer : - Normal : Type de cube normal, type par dfaut. - Attribut : un cube Attribute sera cr avec la cration dun cube normal. - System : Type de cube systme. - User Info : un cube User Info sera cr/modifi par ce composant.

Commit size

Saisissez le nombre de lignes de chaque lot rcuprer.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Les colonnes MEASURE et TEXT sont en lecture seule, mais vous pouvez ajouter dautres colonnes. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur Talend Open Studio. Cube Query Remplissez ce tableau pour prciser les donnes que vous souhaitez rcuprer. Column : les colonnes du schma sont ajoutes automatiquement cette colonne, une fois dfinies dans lditeur du schma. Les colonnes du schma sont utilises pour stocker les lments de dimensions rcuprs. Dimensions : saisissez le nom de chaque dimension du cube duquel vous souhaitez rcuprer les lments de dimensions. Lordre des dimensions dans cette colonne doit tre cohrent avec lordre dans le cube stockant ces dimensions. Elements : saisissez les lments de dimensions desquels rcuprer les donnes. Si plusieurs lments dune dimension sont requis, sparez-les avec une virgule. Advanced settings Utilisation Connections tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Liens de sortie (dun composant un autre) : Row : Main Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate.

Ce composant requiert un composant de sortie.

Guide de Rfrence des Composants Talend Open Studio

219

Scnario : Rcuprer des lments de dimensions dans un cube donn

Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio. Limitation Selon larchitecture des systmes OLAP, une seule valeur (texte ou numrique) peut tre rcupre du cube. Les colonnes MEASURE et TEXT sont fixes et en lecture seule.

Scnario : Rcuprer des lments de dimensions dans un cube donn


Le Job de ce scnario rcupre plusieurs lments de dimensions du cube de dmo Palo Sales.

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloInputMulti et un tLogRow de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le composant tPaloInputMulti afin douvrir son menu contextuel. Dans le menu, slectionnez Row > Main afin de relier le tPaloInputMulti au tLogRow. Double-cliquez sur le tPaloInputMulti afin douvrir sa vue Component.

220

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer des lments de dimensions dans un cube donn

Dans le champ Host name, saisissez le nom de lhte ou ladresse IP du serveur hte, localhost dans cet exemple. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, lidentifiant et le mot de passe sont admin. Dans le champ Database, saisissez le nom de la base de donnes dans laquelle est stock le cube. Dans le champ Cube, saisissez le nom du cube dans lequel sont stockes les dimensions qui vous intressent Dans ce scnario, le cube est celui de dmo, Sales. Dans le champ Cube type, slectionnez le type du cube crer. Choisissez Normal, ce qui signifie que le cube sera de type Normal, le type par dfaut. A ct du champ Edit Schema, cliquez sur le bouton [...] pour ouvrir lditeur de schma.

Dans lditeur du schma, cliquez sur le bouton [+] pour ajouter les lignes ncessaires. Dans cet exemple, ajoutez les lignes correspondant toutes les dimensions stockes dans le cube Sales : Products, Regions, Months, Years, Datatypes, Measures. Saisissez les noms dans lordre donn de ce cube. Cliquez sur OK pour valider les modifications et acceptez la propagation du changement au composant suivant. Ces colonnes sont ajoutes automatiquement dans la colonne Column du tableau Cube Query dans la vue Component. Si lordre nest pas cohrent par rapport celui du cube Sales, dplacez les colonnes laide des flches montante et descendante. Dans la colonne Dimensions du tableau Cube Query, saisissez le nom de chaque dimension stocke dans le cube Sales selon lordre des lignes dans la colonne Column. Dans le cube Sales, le nom des dimensions est : Products, Regions, Months, Years, Datatypes, Measures. Dans la colonne Elements du tableau Cube Query, saisissez le nom des lments de dimensions que vous souhaitez rcuprer selon la dimension laquelle ils appartiennent. Dans cet exemple, les lments rcuprer sont All products, Germany, Austria, Jan, 2009, Actual, Turnover (Germany et Austria appartenant la mme dimension Regions, ils doivent tre saisis dans la mme ligne et spars par une virgule). Cliquez sur le tLogRow afin douvrir sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

221

Scnario : Rcuprer des lments de dimensions dans un cube donn

Dans la zone Mode, slectionnez loption Table (print values in cell of a table) pour afficher les rsultats de lexcution sous forme de tableau. Appuyez sur F6 pour excuter le Job. Les lments de dimensions et la valeur Measure correspondant saffichent dans la console de la vue Run.

222

Guide de Rfrence des Composants Talend Open Studio

tPaloOutput

tPaloOutput

Proprits du tPaloOutput
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloOutput crit une ligne de donnes (des lments ainsi que des valeurs) dans un cube Palo donn. Ce composant prend le flux dentre et lcrit dans un Cube Palo donn. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Cube Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle se trouve le cube qui vous intresse. Saisissez le nom du cube dans lequel les donnes entrantes sont crites. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

Guide de Rfrence des Composants Talend Open Studio

223

Scnario associ

Commit size

Saisissez le nombre de lignes de chaque lot devant tre crit dans le cube.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur Talend Open Studio. Column as Measure Slectionnez la colonne du flux dentre contenant les valeurs Measure ou Text.

Create element if not Cochez cette case afin de crer llment traiter sil exist nexiste pas. Save cube at process Cochez cette case afin de sauvegarder le cube dans lequel end vous avez crit les donnes la fin du processus. Advanced settings Utilisation Global variable tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Number of lines : Indique le nombre de lignes traites. Disponible en tant que variable After. Retourne un entier. Connections Liens de sortie (dun composant un autre) : Row : Iterate. Trigger : Run if. Liens dentre (dun composant un autre) : Row : Main, Reject. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio. Limitation Ce composant ne peut crire quune seule ligne de donnes dans un cube.

Ce composant requiert un composant dentre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario 1 : Ecrire des donnes dans un cube donn .

224

Guide de Rfrence des Composants Talend Open Studio

tPaloOutputMulti

tPaloOutputMulti

Proprits du tPaloOutputMulti
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloOutputMulti crit des donnes (des lments et des valeurs) dans un cube Palo. Ce composant prend la flux dentre et lcrit dans un cube Palo donn. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Cube Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle se trouve le cube qui vous intresse. Saisissez le nom du cube dans lequel les donnes entrantes sont crites. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

Guide de Rfrence des Composants Talend Open Studio

225

Proprits du tPaloOutputMulti

Cube type

Slectionnez le type de cube dans la liste droulante pour le cube sur lequel lopration donne doit seffectuer : - Normal : Type de cube normal, type par dfaut. - Attribut : un cube Attribute sera cr avec la cration dun cube normal. - System : Type de cube systme. - User Info : un cube User Info sera cr/modifi par ce composant.

Commit size

Saisissez le nombre de lignes de chaque lot devant tre crit dans le cube.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. Measure value Splash mode Slectionnez la colonne du flux dentre contenant les valeurs Measure ou Text. Slectionnez le mode splash utilis pour crire des donnes dans un lment consolid. Le mode peut tre : - Add :crit des valeurs dans les lments sous-jacents. - Default : utilise le mode splash par dfaut. - Set : dfinit simplement la valeur et effectue la distribution partir dautres valeurs. - Disable : napplique aucun splash. Pour plus dinformations concernant les modes splash Palo, consultez le Guide utilisateur de Palo. Add values Cochez cette case pour ajouter des nouvelles valeurs aux valeurs actuelles. Si vous ne cochez pas cette case, les nouvelles valeurs craseront les valeurs actuelles. Cochez cette case pour appeler le serveur de supervision. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Cochez cette case pour collecter les donnes de log au niveau du composant. Liens de sortie (dun composant un autre) : Row : Main

Use eventprocessor Die on error

Advanced settings Utilisation Connections

tStatCatcher Statistics

Ce composant requiert un composant de dbut.

226

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Ecrire des donnes dans un cube donn

Trigger : Run if, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Main, Reject Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio. Limitation Les mesures numriques doivent tre de type Double ou String. Lorsque le type String est utilis, saisissez entre guillemets la valeur devant tre traite.

Scnario 1 : Ecrire des donnes dans un cube donn


Le Job de ce scnario crit de nouvelles valeurs dans le cube Sales donn en dmo dans la base de donnes Demo installe avec Palo.

Pour reproduire ce scnario, procdez comme suit : Dposez un tFixedFlowInput et un tPaloOutputMulti de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le composant tFixedFlowInput afin douvrir son menu contextuel. Dans ce menu, slectionnez Row > Main pour relier ce composant au tPaloOutputMulti. Double-cliquez sur le tFixedFlowInput pour ouvrir sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

227

Scnario 1 : Ecrire des donnes dans un cube donn

Cliquez sur le bouton [...] pour ouvrir lditeur de schma.

Dans lditeur de schma, cliquez sept fois sur le bouton [+] afin dajouter sept lignes. Renommez-les respectivement Products, Regions, Months, Years, Datatypes, Measures et Values. Lordre de ces lignes doit tre cohrent avec celui des dimensions correspondantes dans le cube Sales et le type de la colonne Value, qui comprend la valeur de la mesure, est dfini comme double/Double. Cliquez sur OK afin de valider la modification et acceptez la propagation propose par la bote de dialogue qui souvre. Les libells des colonnes du schma saffichent automatiquement dans le tableau Value sous la case Use single table de la zone Mode. Dans le tableau Value, saisissez la valeur de chaque ligne dans la colonne Value. Ces valeurs sont : Desktop L, Germany, Jan, 2009, Actual, turnover, 1234.56. Double-cliquez sur le composant tPaloOutputMulti afin douvrir sa vue Component.

Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin.

228

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Refuser un flux de donnes dentre lorsque les lments crire nexistent pas dans un cube donn Dans le champ Database, saisissez le nom de la base de donnes dans laquelle vous souhaitez crer le cube, Biker dans cet exemple. Dans le champ Cube, saisissez le nom que vous souhaitez utiliser pour le cube crer, bikerTalend, par exemple. Dans le champ Cube type, slectionnez le type Normal dans la liste droulante. Cela signifie que le cube crer sera de type Normal, le type par dfaut. Dans le champ Measure Value, slectionnez Value. Appuyez sur F6 pour excuter le Job. Le flux dentre de donnes a t crit dans le cube Sales.

Scnario 2 : Refuser un flux de donnes dentre lorsque les lments crire nexistent pas dans un cube donn
Le Job de ce scnario essaye dcrire des donnes dans le cube Sales mais puisque les lments concerns nexistent pas dans ce cube, le flux dentre est refus.

Pour reproduire ce scnario, procdez comme suit : Dposez les composants tFixedFlowInput, tPaloCheckElements, tPaloOutputMulti et tLogRow de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le tFixedFlowInput afin douvrir son menu contextuel. Dans ce menu, slectionnez Row > Main afin de connecter ce composant au tPaloCheckElements.

Guide de Rfrence des Composants Talend Open Studio

229

Scnario 2 : Refuser un flux de donnes dentre lorsque les lments crire nexistent pas dans un cube donn Double-cliquez sur le tFixedFlowInput afin douvrir sa vue Component.

Cliquez sur le bouton [...] afin douvrir lditeur de schma.

Dans lditeur de schma, cliquez sept fois sur le bouton [+] afin dajouter sept lignes que vous allez nommer respectivement Products, Regions, Months, Years, Datatypes, Measures et Values. Lordre de ces lignes doit tre cohrent avec celui des dimensions correspondantes dans le cube Sales et le type de la colonne Value, qui comprend la valeur de la mesure et qui est dfini comme double/Double. Cliquez sur OK afin de valider la modification et acceptez la propagation propose par la bote de dialogue qui souvre. Les libells des colonnes du schma saffichent automatiquement dans le tableau Value sous la case Use single table de la zone Mode. Dans le tableau Value, saisissez la valeur de chaque ligne dans la colonne Value. Ces valeurs sont : Desktop L, Germany, Jan, 2009, Actual, turnover, 1234.56. Double-cliquez sur le composant tPaloCheckElements afin douvrir sa vue Component.

230

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Refuser un flux de donnes dentre lorsque les lments crire nexistent pas dans un cube donn

Dans le champ Host name, saisissez localhost. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin. Dans le champ Database, saisissez le nom de la base de donnes dans laquelle vous souhaitez crer le cube, Demo dans cet exemple. Dans le champ Cube, saisissez le nom du cube dans lequel vous souhaitez crire les donnes, Sales, par exemple. Dans le champ On Element Error, slectionnez Reject dans la liste droulante. Dans le tableau contenant les lments en bas de la vue Basic settings, cliquez sur la cellule au croisement de la ligne Value et de la colonne Element type. Slectionnez Measure dans la liste droulante. Double-cliquez sur le tPaloOutputMulti pour afficher sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

231

Scnario 2 : Refuser un flux de donnes dentre lorsque les lments crire nexistent pas dans un cube donn

Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin. Dans le champ Database, saisissez le nom de la base de donnes dans laquelle vous souhaitez crer le cube, Demo dans cet exemple. Dans le champ Cube, saisissez le nom du cube dans lequel vous souhaitez crire les donnes, Sales, par exemple. Dans le champ Cube type, slectionnez le type Normal dans la liste droulante. Cela signifie que le cube crer sera de type Normal, le type par dfaut. Dans le champ Measure Value, slectionnez Value. Appuyez sur F6 pour excuter votre Job. Les donnes crire sont rejetes et affiches dans la console de la vue Run. Vous pouvez voir que le message derreur est Smart Products.

232

Guide de Rfrence des Composants Talend Open Studio

tPaloRule

tPaloRule

Proprits du tPaloRule
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloRule cre ou modifie des rgles dans un cube Palo donn. Ce composant vous permet de grer des rges dans un cube Palo donn. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Cube Cube rules Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle se trouvent les dimensions appliquant les rgles. Saisissez le nom du cube dans lequel les informations de dimensions doivent tre retrouves. Remplissez ce tableau afin deffectuer diffrentes actions sur les rgles spcifiques : Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

Guide de Rfrence des Composants Talend Open Studio

233

Scnario : Crer une rgle dans un cube donn

- Definition : saisissez la rgle appliquer. - External Id : saisissez lID externe personnalis. - Comment : saisissez un commentaire pour cette rgle. - Activated : cochez cette case afin dactiver la rgle. - Action : slectionnez dans la liste droulante laction effectuer : - Create : crer cette rgle. - Delete : supprimer cette rgle. - Update : mettre jour cette rgle. Advanced settings Utilisation Connections tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en standalone dans la cration dynamique de cubes, avec une liste dfinie de dimensions. Liens de sortie (dun composant un autre) : Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio.

Limitation

La mise jour et la suppression dune rgle ne sont disponibles uniquement lorsque la rgle a t cre avec un ID externe.

Scnario : Crer une rgle dans un cube donn


Le Job de ce scnario cre une rgle applique aux dimensions dun cube donn.

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloRule de la Palette dans lespace de modlisation graphique. Double-cliquez sur le composant tPaloRule afin douvrir sa vue Component.

234

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer une rgle dans un cube donn

Dans le champ Host name, saisissez le nom de lhte ou ladresse IP du serveur hte, localhost dans cet exemple. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo. Dans ce scnario, le numro est 7777. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin. Dans le champ Database, saisissez le nom de la base de donnes dans laquelle se trouvent les dimensions appliquant les rgles, Biker dans cet exemple. Dans le champ Cube, saisissez le nom du cube auquel appartiennent les dimensions appliquant les rgles, Orders dans cet exemple. Sous le tableau Cube rules, cliquez sur le bouton [+] afin dajouter une ligne. Dans le tableau Cube rules, saisissez ['2009'] = 123 dans la colonneDefinition, OrderRule1dans la colonne External Id et Palo Demo Rules dans la colonne Comment. Dans la colonne Activated, cochez la case. Dans la colonne Action, slectionnez Create dans la liste droulante. Appuyez sur F6 afin dexcuter le Job. La nouvelle rgle a t cre et la valeur de chaque lment de 2009 est 123.

Guide de Rfrence des Composants Talend Open Studio

235

Scnario : Crer une rgle dans un cube donn

236

Guide de Rfrence des Composants Talend Open Studio

tPaloRuleList

tPaloRuleList

Proprits du tPaloRuleList
Famille de composant Fonction Objectif Basic settings Business Intelligence/Cube OLAP/Palo Le composant tPaloRuleList rcupre les informations dune liste de rgles dune base de donnes Palo spcifie. Ce composant liste toutes les rgles, les formules, les commentaires, les statuts dactivation, les IDs externes dun cube donn. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Connection configuration Indisponible lors de lutilisation dune connexion existante. Server Port Database Cube Saisissez le numro du port dcoute du serveur Palo. Saisissez le nom de la base de donnes dans laquelle se trouve le cube qui vous intresse. Saisissez le nom du cube dans lequel les informations de rgles doivent tre retrouves. Username et Password Informations dauthentification de lutilisateur de Palo. Host Name Saisissez le nom de lhte ou ladresse IP du serveur hte.

Guide de Rfrence des Composants Talend Open Studio

237

Dcouvrir le schma de sortie en lecture seule du tPaloRuleList

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur Talend Open Studio. Advanced settings Utilisation Global Variables tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en standalone ou en tant que composant de dbut dun processus. Number of rules : indique le nombre de rgles traites. Disponible en tant que variable After. Retourne un entier. External ruleID : indique lID externe de la rgle traite. Disponible en tant que variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

Limitation

Le schma de sortie est fixe et en lecture seule.

Dcouvrir le schma de sortie en lecture seule du tPaloRuleList


Le tableau ci-dessous prsente les informations relatives au schma de sortie en lecture seule du composanttPaloRuleList. Base de donnes rule_identifier Type long Description Identifiant interne de la rgle.

238

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer des informations dtailles concernant des rgles dun cube donn

Base de donnes rule_definition Dimension_attribute_cube rule_extern_id rule_comment rule_activated

Type string string string string boolean

Description Nom de la dimension. Formule de la rgle. Pour plus dinformations concernant cette rgle, consultez le Guide Utilisateur Palo. ID externe personnalis. Commentaire utilisateur de la rgle. Indique si la rgle a t active ou non.

Scnario : Rcuprer des informations dtailles concernant des rgles dun cube donn
Le Job de ce scnario rcupre les informations concernant les rgles appliques dans les dimensions dun cube donn.

Pour reproduire ce scnario, procdez comme suit : Dposez un composant tPaloRuleList et un tLogRow de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le tPaloRuleList afin douvrir son menu contextuel. Dans ce menu, slectionnez Row > Main afin de lier les deux composants. Double-cliquez sur le tPaloRuleList pour ouvrir sa vue Component.

Dans le champ Host name, saisissez le nom de lhte ou ladresse IP du serveur hte, localhost dans cet exemple. Dans le champ Server Port, saisissez le numro du port dcoute du serveur Palo, 7777 dans cet exemple. Dans les champs Username (identifiant) et Password (mot de passe), saisissez vos informations dauthentification. Dans cet exemple, les deux sont admin.

Guide de Rfrence des Composants Talend Open Studio

239

Scnario : Rcuprer des informations dtailles concernant des rgles dun cube donn

Dans le champ Database, saisissez le nom de la base de donnes dans laquelle se trouvent les dimensions appliquant les rgles qui vous intressent, Biker dans cet exemple. Dans le champ Cube, saisissez le nom du cube auquel les rgles qui vous intressent appartiennent. Appuyez sur F6 pour excuter le Job. Les informations de toutes les rgles du cubeOrders sont rcupres et affiches dans la console de la vue Run.

Pour plus dinformations concernant le schma de sortie, consultez la section intitule Dcouvrir le schma de sortie en lecture seule du tPaloRuleList .

240

Guide de Rfrence des Composants Talend Open Studio

tParAccelSCD

tParAccelSCD

Proprits du tParAccelSCD
Famille du composant Fonction Objectif Databases/Business Intelligence/ParAccel Le composant tParAccelSCD reflte et traque les modifications dune table ParAccel SCD ddie. Le tParAccelSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case si vous utilisez un tParAccelConnection tion. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de la base de donnes.

Guide de Rfrence des Composants Talend Open Studio

241

Scnario associ

Table

Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de construire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

tStatCatcher Statistics Debug mode

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

242

Guide de Rfrence des Composants Talend Open Studio

tPostgresPlusSCD

tPostgresPlusSCD

Proprits du tPostgresPlusSCD
Famille de composant Databases/Business Intelligence/Postgresplus Server Le composant tPostgresPlusSCD reflte et traque les modifications dune table SCD PostgresPlus ddie. Le tPostgresPlusSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma de la base de donnes.

Fonction Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

243

Scnario associ

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de construire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Advanced settings saving Cochez cette case pour amliorer les performances du systme. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

tStatCatcher Statistics Debug mode

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

244

Guide de Rfrence des Composants Talend Open Studio

tPostgresPlusSCDELT

tPostgresPlusSCDELT

Proprits du tPostgresPlusSCDELT
Famille du composant Fonction Objectif Databases/Business Intelligence/PostgresPlus Le composant tPostgresPlusSCDELT reflte et traque les modifications dune table PostgresPlus SCD ddie. Le tPostgresPlusSCDELT adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table PostgresPlus SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tPostgresPlusConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

245

Proprits du tPostgresPlusSCDELT

Source table Table Action on table

Nom de la table contenant les donnes filtrer. Nom de la table crire. Notez quune seule table peut tre crire la fois pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Surrogate Key Creation Slectionnez dans la liste une colonne utiliser comme cl de substitution. Slectionnez la mthode utiliser pour gnrer la cl de substitution. Pour plus dinformations concernant les mthodes de cration, consultez la section intitule Cls SCD . Source Keys Use SCD Type 1 fields Slectionnez une colonne ou plus utiliser en tant que cl(s) pour assurer lunicit des donnes entrantes. Utilisez le type 1 si vous navez pas besoin de traquer les modifications, pour des corrections typographiques par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Utilisez le type 2 si vous avez besoin de traquer les modifications, pour garder une trace des mises jour effectues par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Start date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de dpart. Vous pouvez slectionner lune des colonnes dentre du schma comme date de dpart (Start Date) dans la table SCD.

Use SCD Type 2 fields

246

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

End Date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de fin pour le journal. Lorsque le journal est en mode actif, la colonne End Date a une valeur nulle ; pour viter cela, vous pouvez slectionner loption Fixed Year value et saisir une anne fictive. Log Active Status : Ajoute une colonne votre schma SCD pour renseigner les valeurs de statut true et false . Cette colonne permet de reprer facilement le journal actif. Log versions : Ajoute une colonne votre schma SCD pour renseigner le numro de version du journal. Advanced settings Debug mode tStatCatcher Statistics Utilisation Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie et une connexion de type Row Main.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

Guide de Rfrence des Composants Talend Open Studio

247

tPostgresqlSCD

tPostgresqlSCD

Proprits du tPostgresqlSCD
Famille de composant Databases/Business Intelligence/Postgresql Server Le composant tPostgresqlSCD reflte et traque les modifications dune table SCD Postgresql ddie. Le tPostgresqlSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Property type Peut tre Built-in ou Repository. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma de la base de donnes.

Fonction Objectif

Basic settings

248

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de constuire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

tStatCatcher Statistics Debug mode

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

Guide de Rfrence des Composants Talend Open Studio

249

tPostgresqlSCDELT

tPostgresqlSCDELT

Proprits du tPostgresqlSCDELT
Famille du composant Fonction Objectif Databases/Business Intelligence/Postgresql Le composant tPostgresqlSCDELT reflte et traque les modifications dune table Postgresql SCD ddie. Le tPostgresqlSCDELT adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table Postgresql SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tPostgresqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Source table Nom de la table contenant les donnes filtrer.

250

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPostgresqlSCDELT

Table Action on table

Nom de la table crire. Notez quune seule table peut tre crire la fois pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Surrogate Key Creation Slectionnez dans la liste une colonne utiliser comme cl de substitution. Slectionnez la mthode utiliser pour gnrer la cl de substitution. Pour plus dinformations concernant les mthodes de cration, consultez la section intitule Cls SCD . Source Keys Use SCD Type 1 fields Slectionnez une colonne ou plus utiliser en tant que cl(s) pour assurer lunicit des donnes entrantes. Utilisez le type 1 si vous navez pas besoin de traquer les modifications, pour des corrections typographiques par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Utilisez le type 2 si vous avez besoin de traquer les modifications, pour garder une trace des mises jour effectues par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Start date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de dpart. Vous pouvez slectionner lune des colonnes dentre du schma comme date de dpart (Start Date) dans la table SCD. End Date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de fin pour le journal.

Use SCD Type 2 fields

Guide de Rfrence des Composants Talend Open Studio

251

Scnario associ

Lorsque le journal est en mode actif, la colonne End Date a une valeur nulle ; pour viter cela, vous pouvez slectionner loption Fixed Year value et saisir une anne fictive. Log Active Status : Ajoute une colonne votre schma SCD pour renseigner les valeurs de statut true et false . Cette colonne permet de reprer facilement le journal actif. Log versions : Ajoute une colonne votre schma SCD pour renseigner le numro de version du journal. Advanced settings Debug mode tStatCatcher Statistics Utilisation Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie et une connexion de type Row Main.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

252

Guide de Rfrence des Composants Talend Open Studio

tSPSSInput

tSPSSInput

Avant de pouvoir utiliser toutes les fonctionnalits des composants SPSS, assurez-vous de de suivre les tapes suivantes : -Si vous avez dj install SPSS, ajoutez le chemin du rpertoire SPSS, qui se prsente comme suit : SET PATH=%PATH%;<DR>:\program\SPSS. -Si vous navez pas encore install SPSS, copiez le lib SPSS IO spssio32.dll partir du CD dinstallation et copiez-le dans votre rpertoire system32.

Proprits du tSPSSInput
Famille du composant Fonction Objectif Basic settings Business Intelligence Le composant tSPSSInput lit les donnes de fichiers SPSS (.sav). Le tSPSSInput envoie des donnes SPSS pour les crire, dans un autre fichier par exemple. Sync schema Cliquez sur ce bouton pour synchroniser le schma avec les colonnes du fichier SPSS dentre.

Schema et Edit Schema Pour ce composant, le schma des mtadonnes est directement rcupr partir du fichier SPSS dentre, cest pourquoi il est en lecture seule. Vous pouvez cliquer sur Edit schema pour voir les mtadonnes qui ont t rcupres. File name Translate labels Indiquez le nom ou le chemin daccs au fichier SPPS lire. Cochez cette case pour traduire les tiquettes (labels) des valeurs stockes. Si vous cochez cette case, vous devrez nouveau rcuprer les mtadonnes. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis comme composant de dbut. Il requiert un composant de sortie.

Scnario : Afficher le contenu dun fichier SPSS


Le scnario suivant cre un Job deux composants qui permet de lire chaque ligne dun fichier SPSS (.sav) et de les afficher en sortie dans la console de log de la vue Run. A partir de la Palette, dposez les composants tSPSSInput et tLogRow dans lespace graphique.

Guide de Rfrence des Composants Talend Open Studio

253

Scnario : Afficher le contenu dun fichier SPSS

Cliquez-droit sur le composant tPSSInput et connectez-le au tLogRow laide dun lien de type Main Row. Double-cliquez sur le composant tSPSSInput pour afficher la vue Basic settings et configurer ses paramtres.

Cliquez sur le bouton [...] ct du champ Filename pour parcourir vos dossiers jusquau fichier SPSS que vous voulez lire. Cliquez sur le bouton [...] ct du champ Sync schema. Un message apparat lcran pour vous inviter rcuprer le schma du fichier SPSS slectionn.

Cliquez sur le bouton Yes pour fermer le message. Si ncessaire, cliquez sur le bouton [...] ct du champ Edit schema pour visualiser la structure de donnes prdfinie dans le fichier SPSS source.

Cliquez sur le bouton OK pour fermer la bote de dialogue. Sauvegardez votre Job, et appuyez sur F6 afin de lexcuter.

254

Guide de Rfrence des Composants Talend Open Studio

Scnario : Afficher le contenu dun fichier SPSS

Le fichier SPSS est lu ligne par ligne, et les champs extraits sont affichs dans la console.

Afin deffectuer des traductions sur les valeurs stockes, procdez comme suit : Dans la vue Basic settings, cochez la case Translate label si vous voulez traduire les tiquettes (labels) des valeurs stockes. Cliquez nouveau sur le bouton Sync Schema, afin de rcuprer le schma aprs traduction. Un message apparat, vous demandant si vous souhaitez rcuprer le schma du fichier SPSS dfini. Cliquez sur Yes (Oui) pour fermer le message et procder ltape suivante. Un second message souvre et vous demande si vous souhaitez propager les modifications. Cliquez sur Yes (Oui) afin de fermer le message et passer ltape suivante. Enregistrez le Job puis appuyez sur la touche F6 pour lexcuter. Le fichier SPSS est lu ligne par ligne et les champs extraits sont affichs sur la console de log de la vue Run, aprs traduction des valeurs stockes.

Guide de Rfrence des Composants Talend Open Studio

255

tSPSSOutput

tSPSSOutput

Avant de pouvoir utiliser toutes les fonctionnalits des composants SPSS, assurez-vous de suivre les tapes suivantes : -Si vous avez dj install SPSS, ajoutez le chemin du rpertoire SPSS, qui se prsente comme suit : SET PATH=%PATH%;<DR>:\program\SPSS. -Si vous navez pas encore install SPSS, copiez le lib SPSS IO spssio32.dll partir du CD dinstallation et copiez-le dans votre rpertoire system32.

Proprits du tSPSSOutput
Famille du composant Fonction Objectif Basic settings Business Intelligence Le composant tSPSSOutput crit des donnes dans un fichier SPSS (.sav). Le tSPSSOutput crit ou ajoute des donnes un fichier SPSS. Il cre les fichiers SPSS directement ou crase ceux qui existent dj. Sync schema Cliquez sur ce bouton pour synchroniser le schma avec les colonnes du fichier SPSS dentre.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Filename Write Type Nom ou chemin daccs du fichier SPSS crire. Slectionnez dans la liste le type daction effectuer : Write: crit simplement les nouvelles donnes. Append: crit les nouvelles donnes la suite de celles existantes. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant ne peut tre utilis comme composant de dbut. Il ncessite un flux dentre.

Scnario : Ecrire des donnes dans un fichier .sav


Ce scnario dcrit un Job trs simple qui crit des donnes dentre dans un fichier .sav. Glissez-dposez de la Palette dans lespace de modlisation graphique un tRowGenerator et un tSPSSOutput. Cliquez-droit sur le tRowGenerator, et connectez-le au tSPSSOutput, laide dun lien Row Main.

256

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes dans un fichier .sav

Dans lespace de modlisation graphique, double-cliquez sur le tRowGenerator afin dafficher sa vue Basic settings et ouvrir son diteur. Vous pouvez dfinir votre schma.

Cliquez sur le bouton [+] afin dajouter les colonnes que vous voulez crire dans le fichier .sav. Dfinissez le schma, et configurez les paramtres des colonnes. Vrifiez que vous avez dfini la longueur de vos colonnes. Dans le cas contraire, un message derreur saffichera lors de la construction du Job. Cliquez sur OK afin de valider votre schma et fermer lditeur. Double-cliquez sur le tSPSSOutput afin dafficher sa vue Component et dfinir ses proprits.

Cliquez sur le bouton [...] ct du champ Filename, et parcourez votre rpertoire jusquau fichier SPSS .sav dans lequel vous souhaitez crire les donnes. Cliquez sur le bouton [...] ct du bouton Sync columns, afin de synchroniser les colonnes avec celles du composant prcdent. Dans cet exemple, le schma devant tre insr dans le fichier .sav est compos de deux colonnes : id et country.

Guide de Rfrence des Composants Talend Open Studio

257

Scnario : Ecrire des donnes dans un fichier .sav

Si ncessaire, cliquez sur le bouton Edit schema pour voir/diter le schma dfini. Dans la liste Write Type, slectionnez Write (crire) ou Append (crire la suite), pour simplement crire les donnes dentre dans le fichier .sav, ou bien les crire la fin de ce mme fichier. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Les donnes gnres par le tRowGenerator sont crites dans le fichier .sav dfini.

258

Guide de Rfrence des Composants Talend Open Studio

tSPSSProperties

tSPSSProperties

Pour pouvoir utiliser toutes les fonctionnalits des composants SPSS, assurez-vous de suivre les tapes suivantes : -Si vous avez dj install SPSS, ajoutez le chemin du rpertoire SPSS, qui se prsente comme suit : SET PATH=%PATH%;<DR>:\program\SPSS. -Si vous navez pas encore install SPSS, copiez le lib SPSS IO spssio32.dll partir du CD dinstallation et copiez-le dans votre rpertoire system32.

Proprits du tSPSSProperties
Famille du composant Fonction Objectif Basic settings Business Intelligence Le composant tSPSSProperties dcrit les proprits dun fichier SPSS (.sav) dfini. Le tSPSSProperties permet dobtenir des informations sur les proprits principales dun fichier SPSS dfini. Schema et Edit Schema Pour ce composant, le schma des mtadonnes est prdfini, cest pourquoi il est en lecture seule. Vous pouvez cliquer sur Edit schema pour voir les mtadonnes prdfinies. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Filename Advanced settings Utilisation tStatCatcher Statistics Nom ou chemin daccs au fichier SPSS traiter. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis comme composant de dbut. Il requiert un composant de sortie.

Scnario associ
Pour des scnarios associs, consultez : la section intitule Scnario : Lire les donnes matre dun hub MDM la section intitule Scnario : Ecrire des donnes dans un fichier .sav

Guide de Rfrence des Composants Talend Open Studio

259

tSPSSStructure

tSPSSStructure

Avant de pouvoir utiliser toutes les fonctionnalits des composants SPSS, assurez-vous de suivre les tapes suivantes : -Si vous avez dj install SPSS, ajoutez le chemin du rpertoire SPSS, qui se prsente comme suit : SET PATH=%PATH%;<DR>:\program\SPSS. -Si vous navez pas encore install SPSS, copiez le lib SPSS IO spssio32.dll partir du CD dinstallation et copiez-le dans votre rpertoire system32.

Proprits du tSPSSStructure
Famille du composant Fonction Purpose Business Intelligence Le composant tSPSSStructure rcupre les informations sur les variables contenues dans le fichier SPSS (.sav). Le tSPSSStructure traite les variables contenues dans des fichiers SPSS. Vous pouvez utiliser ce composant avec le tFileList pour rcuprer les informations des fichiers *.sav existant et les utiliser pour analyser de manire plus approfondie ou pour vrifier vos rsultats. Schema et Edit Schema Pour ce composant, le schma des mtadonnes est prdfini, cest pourquoi il est en lecture seule. Il correspond la convention interne SPSS. Vous pouvez cliquer sur Edit schema pour voir les mtadonnes prdfinies. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Filename Advanced settings Utilisation tStatCatcher Statistics Nom ou chemin daccs au fichier SPSS traiter. Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est utilis comme composant de dbut. Il requiert un composant de sortie.

Scnario associ
Pour des scnarios associs, consultez : la section intitule Scnario : Lire les donnes matre dun hub MDM la section intitule Scnario : Ecrire des donnes dans un fichier .sav

260

Guide de Rfrence des Composants Talend Open Studio

tSybaseSCD

tSybaseSCD

Proprits du tSybaseSCD
Famille du composant Fonction Objectif Databases/Business Intelligence/Sybase Le composant tSybaseSCD reflte et traque les modifications dune table SCD Sybase ddie. Le tSybaseSCD adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de la base de donnes.

Guide de Rfrence des Composants Talend Open Studio

261

Scnario associ

Table

Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur Talend Open Studio. SCD Editor Lditeur SCD Editor permet de construire et de configurer les donnes du flux de sortie vers la table Slowly Changing Dimension. Pour plus dinformations, consultez la section intitule Mthodologie de gestion du SCD . Use memory Mode Die on error saving Cochez cette case pour amliorer les performances du systme. Cette case est dcoche par dfaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. tStatCatcher Statistics Debug mode Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Utilisation

Ce composant est un composant de sortie. Par consquent, il requiert un composant et une connexion de type Row Main en entre.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Traquer des modifications avec les Slowly Changing Dimensions de type 0 3 .

262

Guide de Rfrence des Composants Talend Open Studio

tSybaseSCDELT

tSybaseSCDELT

Proprits du tSybaseSCDELT
Famille du composant Fonction Objectif Databases/Business Intelligence/Sybase Le composant tSybaseSCDELT reflte et traque les modifications dune table Sybase SCD ddie. Le tSybaselSCDELT adresse des besoins en transformation Slowly Changing Dimension, en lisant rgulirement une source de donnes et en rpertoriant les modifications dans une table Sybase SCD ddie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tSytion baseConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Source table Nom de la table contenant les donnes filtrer.

Guide de Rfrence des Composants Talend Open Studio

263

Proprits du tSybaseSCDELT

Table Action on table

Nom de la table crire. Notez quune seule table peut tre crire la fois pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Surrogate Key Creation Slectionnez dans la liste une colonne utiliser comme cl de substitution. Slectionnez la mthode utiliser pour gnrer la cl de substitution. Pour plus dinformations concernant les mthodes de cration, consultez la section intitule Cls SCD . Source Key Use SCD Type 1 fields Slectionnez une colonne ou plus utiliser en tant que cl(s) pour assurer lunicit des donnes entrantes. Utilisez le type 1 si vous navez pas besoin de traquer les modifications, pour des corrections typographiques par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Utilisez le type 2 si vous avez besoin de traquer les modifications, pour garder une trace des mises jour effectues par exemple. Slectionnez les colonnes du schma qui servira de rfrence pour les modifications. Start date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de dpart. Vous pouvez slectionner lune des colonnes dentre du schma comme date de dpart (Start Date) dans la table SCD. End Date : Ajoute une colonne votre schma SCD pour dterminer la valeur de la date de fin pour le journal. Lorsque le journal est en mode actif, la colonne End Date a une valeur nulle ; pour viter cela, vous pouvez slec-

Use SCD Type 2 fields

264

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

tionner loption Fixed Year value et saisir une anne fictive. Log Active Status : Ajoute une colonne votre schma SCD pour renseigner les valeurs de statut true et false. Cette colonne permet de reprer facilement le journal actif. Log versions : Ajoute une colonne votre schma SCD pour renseigner le numro de version du journal. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. Debug mode tStatCatcher Statistics Utilisation Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie et une connexion de type Row Main.

Scnario associ
Pour un scnario associ, consultez la section intitule tMysqlSCD .

Guide de Rfrence des Composants Talend Open Studio

265

Guide de Rfrence des Composants Talend Open Studio

Composants Cloud
Ce chapitre passe en revue les principaux composants prsents dans la famille Cloud de la Palette de Talend Open Studio. Les bases de donnes, les services de donnes et les applications bases SaaS (CRM, HR, ERP, etc.) hbergs dans des clouds privs et publics se multiplient, accompagns dapplications et de bases de donnes sur site qui constituent le fondement de linformatique dentreprise La famille Cloud regroupe les connecteurs de bases de donnes les plus populaires. Ces connecteurs couvrent divers besoins : ouverture de connexion, lecture et criture de tables, commit de transactions, ainsi que des rollbacks pour le traitement des erreurs.

Guide de Rfrence des Composants Talend Open Studio

tAmazonMysqlClose

tAmazonMysqlClose

Proprits du tAmazonMysqlClose
Fonction Objectif Basic settings Le composant tAmazonMysqlClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tAmazonMysqlConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant doit tre utilis avec des composants AmazonMysql, notamment avec le tAmazonMysqlCommit et le tAmazonMysqlConnection. n/a

Scnario associ
Ce composant est troitement li aux composants tAmazonMysqlConnection et tAmazonMysqlRollback. Il est gnralement utilis avec un composant tAmazonMysqlConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tAmazonMysqlClose, consultez la section intitule tMysqlConnection

268

Guide de Rfrence des Composants Talend Open Studio

tAmazonMysqlCommit

tAmazonMysqlCommit

Proprits du tAmazonMysqlCommit
Ce composant est troitement li aux composants tAmazonMysqlConnection et tAmazonMysqlRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Cloud/ AmazonRDS/MySQL Le composant AmazontMysqlCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tAmazonMysqlConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tAmazonMysqlCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Close connection

Ce composant est gnralement utilis avec des composants AmazonMysql et notamment avec les composants tAmazonMysqlConnection et tAmazonMysqlRollback. n/a

Limitation

Scnario associ
Ce composant est troitement li aux composants tAmazonMysqlConnection et tAmazonMysqlRollback. Ils sont gnralement utiliss avec un composant tAmazonMysqlConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tAmazonMysqlCommit, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

269

tAmazonMysqlConnection

tAmazonMysqlConnection

Proprits du tAmazonMysqlConnection
Ce composant est troitement li aux composants tAmazonMysqlCommit et tAmazonMysqlRollback. Ils sont gnralement utiliss avec un composant tAmazonMysqlConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Cloud/ AmazonRDS/MySQL Le composant tAmazonMysqlConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Host Port Database MySQL 5 est disponible. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Utilisation Limitation Ce composant est gnralement utilis avec des composants AmazonMysql, notamment les composants tAmazonMysqlCommit and tAmazonMysqlRollback. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

270

Guide de Rfrence des Composants Talend Open Studio

tAmazonMysqlInput

tAmazonMysqlInput

Proprits du tAmazonMysqlInput
Famille de compo- Cloud/ sant AmazonRDS/MySQL Fonction Objectif Le composant tAmazonMysqlInput lit une base de donnes et en extrait des champs laide de requtes. Le tAmazonMysqlInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version MySQL 5 est disponible. Use an existing Cochez cette case lorsque vous utilisez le composant tAmazonMysconnection qlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de Talend Open Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Pass- Informations dauthentification de lutilisateur de base de donnes. word

Guide de Rfrence des Composants Talend Open Studio

271

Scnarios associs

Schema Schema

et

Edit Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository). Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio.

Table Name

Nom de la table lire.

Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Advanced settings Additional parameters JDBC Spcifiez des informations supplmentaires de connexion la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Lorsque vous devez traiter des donnes au format date/heure 0000-00-00 00:00:00 utilisant ce composant, dfinissez les paramtres comme suit : noDatetimeStringSync=true&zeroDateTimeBehavior=convertToNull. Enable stream Cochez cette case pour dterminer avec quelles lignes vous souhaitez travailler. Cette option permet damliorer les performances.

Trim all the String/ Cochez cette case pour supprimer les espaces en dbut et en fin de Char columns champ dans toutes les colonnes contenant des chanes de caractres. Trim column Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Dcochez Trim all the String/Char columns pour activer le tableau Trim column. tStatCatcher Statis- Cochez cette case pour collecter les donnes de log au niveau du tics composant. Usage Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes MySQL.

Scnarios associs
Pour des scnarios associs, consultez la section intitule tMysqlInput .

272

Guide de Rfrence des Composants Talend Open Studio

tAmazonMysqlOutput

tAmazonMysqlOutput

Proprits du tAmazonMysqlOutput
Famille de composant Fonction Objectif Basic settings Cloud/ AmazonRDS/MySQL Le composant tAmazonMysqlOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tAmazonMysqlOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version MySQL 5 est disponible. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tAtion mazonMysqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de Talend Open Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes

Guide de Rfrence des Composants Talend Open Studio

273

Proprits du tAmazonMysqlOutput

Table Action on table

Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : Default : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Action on data

Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Insert or update on duplicate key or unique index : Ajouter des entres si la valeur insre n'existe pas ou mettre jour les entres si la valeur insre existe dj et quun risque de violation dune cl unique se prsente. Insert ignore : Ajouter uniquement de nouvelles lignes afin dempcher les erreurs de doublons de cls. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant

274

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAmazonMysqlOutput

la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Extend Insert Cochez cette case pour insrer un ensemble de lignes dfinies au lieu dinsrer les lignes une par une. Cette option permet un important gain de performance. Number of rows per insert : saisissez le nombre de lignes insrer en un bloc. Notez que si vous slectionnez un nombre important de lignes, cela peut augmenter la quantit de mmoire utilise et donc diminuer les performances. Cette option nest pas compatible avec le lien Reject. Vous devez donc la dcocher si vous utilisez un lien Reject en sortie du composant. Si vous utilisez ce composant avec un tMysqlLastInsertID , soyez sr de dcocher la case Extend Insert dans la vue Advanced Settings . Extend Insert permet le chargement par lots, cependant, si la case est coche, seul l'ID de la dernire ligne du dernier lot sera retourn. Use Batch size Cochez cette case afin dactiver le mode batch pour le traitement des donnes. Dans le champ Batch Size qui apparat, vous pouvez saisir le nombre de lignes par lot charger. Cette case est disponible uniquement si vous avez choisi loption Insert, Update, Single In-

Guide de Rfrence des Composants Talend Open Studio

275

Proprits du tAmazonMysqlOutput

sert Query ou Delete dans le champ Action on data. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tAmazonMysqlOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Use Hint Options Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour activer la zone de configuration des indicateurs (ou Hints) permettant doptimiser lexcution dune requte. Dans cette zone, les paramtres sont : - HINT : spcifiez lindicateur dont vous avez besoin, en utilisant la syntaxe /*+ */ - POSITION : spcifiez la place de lindicateur dans une instruction SQL. - SQL STMT : slectionnez linstruction SQL que vous souhaitez utiliser. Enable debug mode Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes.

Additional Columns

Use duplicate key up- Met jour les valeurs des colonnes spcifies en cas de date mode insert doublon de la cl primaire. Column : Saisissez entre guillemets le nom de la colonne mettre jour. Value : Saisissez lopration que vous souhaitez effectuer sur la colonne. Pour utiliser cette option, vous devez pralablement slectionner le mode Insert dans la liste Action on data de la vue Basic settings. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

276

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Ce composant doit tre utilis en tant que composant de sortie. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes MySQL. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation du tAmazonMysqlOutput, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject .

Scnarios associs
Pour des scnarios associs, consultez la section intitule tMysqlSCD .

Guide de Rfrence des Composants Talend Open Studio

277

tAmazonMysqlRollback

tAmazonMysqlRollback

Proprits du tAmazonMysqlRollback
Ce composant est troitement li aux composants tAmazonMysqlCommit et tAmazonMysqlConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Cloud/ AmazonRDS/Mysql Le composant tAmazonMysqlRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close connection Advanced settings Utilisation tStatCatcher Statistics Slectionnez le composant tAmazonMysqlConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants AmazonMySQL, notamment les composants tAmazonMysqlConnection et tAmazonMysqlCommit. n/a

Limitation

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

278

Guide de Rfrence des Composants Talend Open Studio

tAmazonMysqlRow

tAmazonMysqlRow

Proprits du tAmazonMysqlRow
Famille de composant Fonction Cloud/Amazon/MySQL Le composant tAmazonMysqlRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, le tAmazonMysqlRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version MySQL 5 est disponible. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tAtion mazonMysqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

279

Proprits du tAmazonMysqlRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Guess Query Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Query

Die on error

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre.

280

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour des scnarios associs, consultez la section intitule tMysqlRow

Guide de Rfrence des Composants Talend Open Studio

281

tAmazonOracleClose

tAmazonOracleClose

Proprits du tAmazonOracleClose
Fonction Objectif Basic settings Le composant tAmazonOracleClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes AmazonOracle. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tAmazonOracleConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis avec d'autres composants AmazonOracle, notamment tAmazonOracleConnection et tAmazonOracleCommit. n/a

Scnario associ
Ce composant est troitement li aux composants tAmazonOracleConnection et tAmazonOracleRollback. Il est gnralement utilis avec un composant tAmazonOracleConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tAmazonOracleClose, consultez la section intitule tMysqlConnection .

282

Guide de Rfrence des Composants Talend Open Studio

tAmazonOracleCommit

tAmazonOracleCommit

Proprits du tAmazonOracleCommit
Ce composant est troitement li aux composants tAmazonOracleConnection et tAmazonOracleRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Cloud/ AmazonRDS/Oracle Le composant tAmazonOracleCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tAmazonOracleConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tOracleCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Close Connection

Ce composant est gnralement utilis avec des composants AmazonOracle et notamment tAmazonOracleConnection et tAmazonOracleRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tAmazonOracleConnection et tAmazonOracleRollback. Ils sont gnralement utiliss avec un composant tAmazonOracleConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tAmazonOracleCommit, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

283

tAmazonOracleConnection

tAmazonOracleConnection

Proprits du tAmazonOracleConnection
Ce composant est troitement li aux composants tAmazonOracleCommit et tAmazonOracleRollback. Ils sont gnralement utiliss avec un composant tOracleConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Cloud/ AmazonRDS/Oracle Le composant tAmazonOracleConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Connection type Liste droulante des pilotes disponibles : Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur un systme. DB Version Use tns file Oracle 11-5 est disponible. Cochez cette case pour utiliser les mtadonnes dun contexte contenu dans un fichier tns. Un mme fichier Tns peut contenir plusieurs contextes. TNS File : Renseignez manuellement le chemin daccs ou cliquez sur le bouton [...] pour parcourir vos dossiers jusquau fichier Tns utiliser. Select a DB Connection in Tns File : Cliquez sur le bouton [...] pour afficher tous les contextes du fichier Tns et slectionner celui utiliser. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma

Username et Password Informations dauthentification de lutilisateur de base de donnes. Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre.

284

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Dans ce champ, vous pouvez paramtrer le type dencodage. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Usage Limitation Ce composant est gnralement utilis avec des composants AmazonOracle, notamment les composants tAmazonOracleCommit et tAmazonOracleRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tAmazonOracleCommit et tAmazonOracleRollback. Ils sont gnralement utiliss avec un composant tAmazonOracleConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tAmazonOracleConnection, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

285

tAmazonOracleInput

tAmazonOracleInput

Proprits du tAmazonOracleInput
Famille de composant Fonction Objectif Cloud/ AmazonRDS/Oracle Le composant tAmazonOracleInput lit une base de donnes et en extrait des champs laide de requtes. Le tAmazonOracleInput excute une requte de base de donnes dans laquelle lordre doit strictement correspondre lordre dfini dans le schma. Puis la liste des champs est transmise au composant via une connexion Main Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionne le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Connection type Liste droulante des pilotes disponibles : Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur in systme. DB Version Slectionnez la version dOracle que vous utilisez. Use an existing connec- Cochez cette case lorsque vous utilisez un composant tAtion mazonOracleConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio.

Basic settings

286

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Host Port Database Oracle schema

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma Oracle.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in: Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository: Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type and Query Nom de la table de base de donnes. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case et dfinissez le nombre de lignes avec lesquelles vous souhaitez travailler en une fois. Cette option permet doptimiser les performances.

Advanced settings

tStatCatcher Statistics Use cursor

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column Usage Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes AmazonOracle.

Scnarios associs
Pour des scnarios associs, consultez : Le premier scnario du composant tDBInput, la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . Le second scnario du composant tDBInput, la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Le scnario du composant tContextLoad, la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL .

Guide de Rfrence des Composants Talend Open Studio

287

tAmazonOracleOutput

tAmazonOracleOutput

Proprits du tAmazonOracleOutput
Famille de composant Fonction Objectif Basic settings Cloud/ AmazonRDS/Oracle Le composant tAmazonOracleOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tAmazonOracleOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tAtion mazonOracleConnection. Lorsque vous la dcochez, une case (coche par dfaut, suivie dun champ) apparat dans les Advanced settings, Batch Size, qui vous permet de saisir le nombre de lignes dans chaque lot de traitement de donnes. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio Connection type Liste droulante des pilotes disponibles :

288

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAmazonOracleOutput

Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur un systme. DB Version Host Port Database Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Oracle schema Table Action on table Nom du schma Oracle. Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : Default : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondant au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour

Guide de Rfrence des Composants Talend Open Studio

289

Proprits du tAmazonOracleOutput

cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Override any exis- Cochez cette case pour craser les ting NLS_LANG envi- d'environnement NLS_LANG dj dfinies. ronment variable Commit every variables

Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence.

tStatCatcher Statistics Additional Columns

290

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Reference column : Saisissez une colonne de rfrence que le composant tOracleOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Use Hint Options Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case afin d'activer la configuration de la zone des Hints, vous permettant ainsi d'optimiser l'excution d'une requte. Dans cette zone, les paramtres sont : - HINT : spcifiez l'hint dont vous avez besoin, l'aide de la syntaxe /*+ */. -POSITION : spcifiez o mettre l'hint dans une instruction SQL. - SQL STMT : slectionnez l'instruction SQL que vous souhaitez utiliser. Convert columns and Cochez cette case pour passer les noms de colonnes et de table to uppercase tables en majuscule. Enable debug mode Use Batch Size Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Nombre de lignes dans chaque lot de traitement de donnes. Si cette case napparat pas, vrifiez que la case Use an existing connection dans les Basic settings est dcoche. Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement lors dune instruction WHERE. Utilisation Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Ce composant doit tre utilis en tant que composant de sortie. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes AmazonOracle. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour des scnarios associs au composant tAmazonOracleOutput, consultez : tDBOutput : la section intitule Scnario : Afficher la base de donnes en sortie tMysqlOutput : la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes .

Guide de Rfrence des Composants Talend Open Studio

291

tAmazonOracleRollback

tAmazonOracleRollback

Proprits du tAmazonOracleRollback
Ce composant est troitement li aux composants tAmazonOracleCommit et tAmazonOracleConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Cloud/ AmazonRDS/Oracle Le composant tAmazonOracleRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close Connection Advanced settings Utilisation tStatCatcher Statistics Slectionnez le composant AmazontOracleConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants AmazonOracle, notamment les composants tAmazonOracleConnection et tAmazonOracleCommit. n/a

Limitation

Scnario associ
Ce composant est troitement li aux composants tAmazonOracleConnection et tAmazonOracleCommit. Ils sont gnralement utiliss ensemble lors dune transaction. Pour un scnario associ au composant tAmazonOracleRollback, consultez la section intitule tMysqlRollback .

292

Guide de Rfrence des Composants Talend Open Studio

tAmazonOracleRow

tAmazonOracleRow

Proprits du tAmazonOracleRow
Famille de composant Fonction Cloud/ AmazonRDS/Oracle Le composant tAmazonOracleRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, le tAmazonOracleRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tAtion mazonOracleConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Connection type Host Port Database Liste droulante des pilotes disponibles. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

293

Proprits du tAmazonOracleRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Query type Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics

294

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour des scnarios associs, consultez : tDBSQLRow: la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes . tMySQLRow: la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL .

Guide de Rfrence des Composants Talend Open Studio

295

tMarketoInput

tMarketoInput

Le composant tMarketoInput appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tMarketoInput .

296

Guide de Rfrence des Composants Talend Open Studio

tMarketoListOperation

tMarketoListOperation

Le composant tMarketoListOperation appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tMarketoListOperation .

Guide de Rfrence des Composants Talend Open Studio

297

tMarketoOutput

tMarketoOutput

Le composant tMarketoOutput appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tMarketoOutput .

298

Guide de Rfrence des Composants Talend Open Studio

tSalesforceBulkExec

tSalesforceBulkExec

Le composant tSalesforceBulkExec appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceBulkExec .

Guide de Rfrence des Composants Talend Open Studio

299

tSalesforceConnection

tSalesforceConnection

Le composant tSalesforceConnection appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceConnection .

300

Guide de Rfrence des Composants Talend Open Studio

tSalesforceGetDeleted

tSalesforceGetDeleted

Le composant tSalesforceGetDeleted appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceGetDeleted .

Guide de Rfrence des Composants Talend Open Studio

301

tSalesforceGetServerTimestamp

tSalesforceGetServerTimestamp

Le composant tSalesforceGetServerTimestamp appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceGetServerTimestamp .

302

Guide de Rfrence des Composants Talend Open Studio

tSalesforceGetUpdated

tSalesforceGetUpdated

Le composant tSalesforceGetUpdated appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceGetUpdated .

Guide de Rfrence des Composants Talend Open Studio

303

tSalesforceInput

tSalesforceInput

Le composant tSalesforceInput appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceInput .

304

Guide de Rfrence des Composants Talend Open Studio

tSalesforceOutput

tSalesforceOutput

Le composant tSalesforceOutput appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceOutput .

Guide de Rfrence des Composants Talend Open Studio

305

tSalesforceOutputBulk

tSalesforceOutputBulk

Le composant tSalesforceOutputBulk appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceOutputBulk .

306

Guide de Rfrence des Composants Talend Open Studio

tSalesforceOutputBulkExec

tSalesforceOutputBulkExec

Le composant tSalesforceOutputBulkExec appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSalesforceOutputBulkExec .

Guide de Rfrence des Composants Talend Open Studio

307

tSugarCRMInput

tSugarCRMInput

Le composant tSugarCRMInput appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSugarCRMInput .

308

Guide de Rfrence des Composants Talend Open Studio

tSugarCRMOutput

tSugarCRMOutput

Le composant tSugarCRMOutput appartient deux familles diffrentes : Business et Cloud. Pour plus dinformations, consultez la section intitule tSugarCRMOutput .

Guide de Rfrence des Composants Talend Open Studio

309

Guide de Rfrence des Composants Talend Open Studio

Composants Custom Code


Ce chapitre passe en revue les principaux composants prsents dans la famille Custom Code de la Palette de Talend Open Studio. La famille Custom Code regroupe tous les composants rpondant un besoin spcifique de cration de code la vole.

Guide de Rfrence des Composants Talend Open Studio

tGroovy

tGroovy

Proprits du tGroovy
Famille de composant Fonction Objectif Basic settings Custom Code Le tGroovy permet de saisir du code personnalis afin de lintgrer dans le programme Talend. Ce code est excut une seule fois. Le tGroovy permet dtendre les fonctionnalits du Job Talend grce au langage Groovy, qui est une syntaxe simplifie du Java.. Groovy Script Variables Saisissez le code Groovy que vous souhaitez excuter. Ce tableau comprend deux colonnes : Name : nom de la variable appele dans le code. Value : valeur associe cette variable. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en standalone, ou en tant que sous-job un seul composant. Il est ncessaire de connatre le langage Groovy.

Scnarios associs
Pour un scnario utilisant du Code Groovy, consultez la section intitule Scnario : Appeler du code Groovy contenu dans un fichier . Pour un exemple dutilisation proche dans le mode de fonctionnement, consultez la section intitule Scnario : Imprimer le contenu dune variable du composant tJava.

312

Guide de Rfrence des Composants Talend Open Studio

tGroovyFile

tGroovyFile

Proprits du tGroovyFile
Famille de composant Fonction Objectif Basic settings Custom Code Le tGroovyFile permet dappeler un script existant dvelopp en Groovy. Le tGroovyFile permet dtendre les fonctionnalits du Job Talend grce au langage Groovy, qui est une syntaxe simplifie du Java.. Groovy File Variables Nom et chemin daccs au fichier contenant votre code Groovy. Ce tableau comprend deux colonnes : Name : nom de la variable appele dans le code. Value : valeur associe cette variable. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en standalone, ou en tant que sous-job un seul composant. Il est ncessaire de connatre le langage Groovy.

Scnario : Appeler du code Groovy contenu dans un fichier


Ce scnario comprend un composant unique, le tGroovyFile, utilis en standalone. Le Job a pour but dappeler un fichier contenant du code Groovy, afin de retourner dans la Console les informations contenues dans ce fichier. Il se prsente comme suit :

Dans la Palette, ouvrez le dossier Custom_Code, puis glissez-dposez un composant tGroovyFile dans lespace de modlisation graphique. Double-cliquez sur le composant afin dafficher sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

313

Scnario : Appeler du code Groovy contenu dans un fichier

Dans le champ Groovy File, saisissez le chemin daccs au fichier contenant votre Code Groovy, ou parcourez votre rpertoire. Dans le tableau Variables, ajoutez une ligne, en appuyant sur le bouton [+]. Dans la colonne Name, saisissez age, puis, dans, la colonne Value, saisissez 50, comme dans la capture dcran.

Appuyez sur F6 pour sauvegarder et excuter votre Job. La Console affiche les informations contenues dans le fichier dentre, auxquelles sajoute le rsultat de la variable.

314

Guide de Rfrence des Composants Talend Open Studio

tJava

tJava

Proprits du tJava
Famille de composant Fonction Objectif Basic settings Custom Code Le tJava permet de saisir du code personnalis afin de lintgrer dans le programme Talend. Ce code est excut une seule fois. Le tJava permet dtendre les fonctionnalits du Job Talend grce au langage Java. Code Saisissez le code Java que vous souhaitez excuter. Pour plus dinformations concernant la syntaxe des fonctions Java spcifiques Talend, consultez laide en ligne de Talend Open Studio dans le menu Help Contents > Developer Guide > API Reference. Pour la rfrence Java complte, allez sur : [http://java.sun.com/javaee/6/docs/ api/]http://java.sun.com/javaee/6/docs/api/ Saisissez le code Java permettant dimporter, si ncessaire, la librairie externe utilise dans le champ Main code de longlet Basic settings. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Import

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis en tant que sous-job un seul composant. Il est ncessaire de connatre le langage Java.

Scnario : Imprimer le contenu dune variable


Le scnario suivant est une simple dmonstration de lapplication possible du composant tJava. Lobjectif de ce Job est dimprimer les lignes traites laide dune commande Java et des variables globales fournies dans Talend Open Studio.

Cliquez et dposez les composants dans lespace de modlisation : tFileInputDelimited, tFileOutputExcel, tJava. Connectez le composant tFileInputDelimited au tFileOutputExcel laide dune connexion de type Row Main. Le contenu du fichier .txt dlimit sera transmis un fichier de type XSL via cette connexion sans subir de transformation.

Guide de Rfrence des Composants Talend Open Studio

315

Scnario : Imprimer le contenu dune variable

Ensuite, connectez le composant tFileInputDelimited au composant tJava laide dun lien de type Then Run. Ce lien met en place un squenage ordonnant au tJava de se lancer la fin du processus principal. Dfinissez les paramtres du composant tFileInputDelimited dans longlet Basic settings de la vue Component. Le fichier dentre utilis en exemple est un simple fichier texte deux colonnes : Name (des noms de personnes) et leur Emails respectifs.

Pour cet exemple, le schma na pas t centralis dans le rfrentiel, vous devez donc configurer manuellement le schma de ces deux colonnes. Cliquez sur le bouton Edit Schema.

Une bote de dialogue vous demandant si vous souhaitez propager les modifications apportes apparat, cliquez sur OK pour accepter la propagation. Ainsi, le schma du composant tFileOutputExcel est automatiquement renseign partir du schma du composant prcdent. Vous naurez donc pas dfinir le schma de nouveau. Paramtrez le fichier de sortie afin quil reoive le contenu du fichier dentre sans modifications. Si le fichier nexiste pas dj, il sera cr.

316

Guide de Rfrence des Composants Talend Open Studio

Scnario : Imprimer le contenu dune variable

Dans cet exemple, dans le champ Sheet name, indiquez le nom de la feuille Excel, ici Email et la case Header est coche pour indiquer que le fichier contient un en-tte. Puis slectionnez le composant tJava pour dfinir la commande Java excuter.

Dans la zone Code, saisissez la commande suivante : String var = "Nb of line processed: "; var = var + globalMap.get("tFileInputDelimited_1_NB_LINE"); System.out.println(var); Dans cet exemple prcis, utilisez la variable NB_Line. Pour accder la liste des variables globales, appuyez sur Ctrl + Espace de votre clavier et slectionnez la variable globale correspondante. Enregistrez le Job et appuyez sur F6 pour lexcuter.

Le contenu est donc transmis au fichier Excel spcifi et le nombre de lignes traites est affich dans la console Run.

Guide de Rfrence des Composants Talend Open Studio

317

tJavaFlex

tJavaFlex

Proprits du tJavaFlex
Famille de composant Fonction Custom Code Le tJavaFlex permet de saisir du code personnalis afin de lintgrer dans le programme Talend. Avec le tJavaFlex, vous pouvez saisir les trois diffrentes parties du code Java (start, main et end) constituant un composant qui permet dexcuter une opration souhaite et non disponible dans les actuels composants Talend. Le tJavaFlex permet dtendre les fonctionnalits du Job Talend grce au langage Java. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement : Guide Utilisateur de Talend Open Studio. Data Auto Propagate Start code Main code End code Advanced settings Import Cochez cette case pour propager automatiquement les donnes au composant suivant. Saisissez le code Java qui va tre appel lors de la phase dinitialisation. Saisissez le code Java qui va tre appliqu pour chaque ligne du flux. Saisissez le code Java qui va tre appel lors de la phase de clture. Saisissez le code Java permettant dimporter, si ncessaire, la librairie externe utilise dans le champ Main code de longlet Basic settings. Cochez cette case pour collecter les donnes de log au niveau du composant.

Objectif Basic settings

tStatCatcher Statistics Utilisation Limitation

Ce composant peut tre utilis en tant que composant de dbut, de milieu et de fin de Job, ainsi quen tant que sous-job un seul composant. Il est ncessaire de connatre le langage Java.

318

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Gnrer un flux de donnes

Scnario 1 : Gnrer un flux de donnes


Ce scnario dcrit un Job deux composants dont le but est de gnrer un flux de trois lignes dcrivant les diffrentes civilit : mademoiselle (Miss), madame (Mrs) et monsieur (Mr), et de les afficher dans la console.

Cliquez-glissez un composant tJavaFlex de la famille Custom Code et un composant tLogRow de la famille Logs & Errors dans le Job Designer. Connectez-les via un lien Row Main. Double-cliquez sur le composant tJavaFlex pour paramtrer ses proprits.

Dans la liste Schema, slectionnez le mode Built-in et cliquez sur le bouton [...] cot du champ Edit schema pour dcrire manuellement la structure des donnes passer au composant suivant.

Cliquez sur le bouton [+] pour ajouter deux colonnes : key de type Integer et value de type String. Cliquez Ok pour valider les changements et fermer la bote de dialogue. Dans les proprits du tJavaFlex, cochez la case Data Auto Propagate pour propager automatiquement les donnes au composant suivant. Dans cet exemple, neffectuez pas de transformation sur les donnes rcupres.

Guide de Rfrence des Composants Talend Open Studio

319

Scnario 1 : Gnrer un flux de donnes

Dans le champ Start code, saisissez le code qui sera excut lors de la phase dinitialisation. Ici, le code indique linitialisation du composant tJavaFlex en affichant le message START et met en place la boucle et les variables utilises par la suite dans le code Java : System.out.println("## START\n#"); String [] valueArray = {"Miss", "Mrs", "Mr"}; for (int i=0;i<valueArray.length;i++) {

Dans le champ Main code, saisissez le code qui sera appliqu pour chaque ligne de donnes. Ici, lobjectif est de retourner chaque cl (key) avec sa valeur : row1.key = i; row1.value = valueArray[i]; Dans le champ Main code, row1 correspond au nom du lien qui sort du tJavaFlex. Si vous renommez ce lien, il faut penser modifier le code de ce champ.

Dans le champ End code, saisissez le code qui sera excut lors de la phase de clture. Ici, laccolade ferme la boucle et le code indique la fin de lexcution du tJavaFlex en affichant le message END : } System.out.println("#\n## END"); Assurez-vous que le schma a bien t propag au tLogRow. Enregistrez le Job et appuyez sur F6 pour lexcuter.

La console affiche les trois civilits, ainsi que leur cls correspondantes.

320

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Traiter des lignes de donnes avec le tJavaFlex

Scnario 2 : Traiter des lignes de donnes avec le tJavaFlex


Ce scnario dcrit un Job deux composants gnrant des donnes de manire alatoire, rcuprant et traitant ces donnes ligne par ligne avec du code Java via le tJavaFlex.

Cliquez-glissez un composant tRowGenerator de la famille Misc et un composant tJavaFlex de la famille Custom Code dans le Job Designer. Connectez-les via un lien Row Main. Double-cliquez sur le composant tRowGenerator pour ouvrir son diteur.

Dans lditeur, cliquez sur le bouton [+] pour ajouter quatre colonnes : number, txt, date et flag. Dfinissez le schma en paramtrant ces quatres colonnes conformment la capture dcran prcdente. Dans la colonne Functions, slectionnez la fonction [...] dans la liste de chaque colonne. Dans la colonne Parameters, saisissez 10 paramtres diffrents pour chaque colonne. Ces 10 paramtres correspondent aux donnes qui seront retournes de manire alatoire lors de lexcution du tRowGenerator. Cliquez sur OK. Double-cliquez sur le composant tJavaFlex pour paramtrer ses proprits.

Guide de Rfrence des Composants Talend Open Studio

321

Scnario 2 : Traiter des lignes de donnes avec le tJavaFlex

Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Dans le champ Start code, saisissez le code qui sera excut lors de la phase dinitialisation. Ici, le code indique linitialisation du composant tJavaFlex en affichant le message START et dfinit une variable qui sera utilise par la suite dans le code Java : System.out.println("## START\n#"); int i = 0;

Dans le champ Main code, saisissez le code qui sera appliqu pour chaque ligne de donnes. Ici, lobjectif est dindiquer le numro de la ligne en partant de 0, puis afficher le numro et le texte alatoire que vous mettez en majuscules et la date alatoire dfinis dans le tRowGenerator. Ensuite, crez une condition affichant si le status est true (vrai) ou false (faux) et incrmentez le numro de la ligne : System.out.print(" row" + i + ":"); System.out.print("# number:" + row1.number); System.out.print (" | txt:" + row1.txt.toUpperCase()); System.out.print(" | date:" + row1.date); if(row1.flag) System.out.println(" | flag: true"); else System.out.println(" | flag: false"); i++; Dans le champ Main code, row1 correspond au nom du lien qui sort du tJavaFlex. Si vous renommez ce lien, il faut penser modifier le code de ce champ.

322

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Traiter des lignes de donnes avec le tJavaFlex

Dans le champ End code, saisissez le code qui sera excut lors de la phase de clture. Ici, le code indique la fin de lexcution du composant tJavaFlex en affichant le message END : System.out.println("#\n## END"); Enregistrez votre Job et appuyez sur F6 pour lexcuter.

La console affiche les donnes gnres alatoirement et modifies laide du code Java dans le tJavaFlex.

Guide de Rfrence des Composants Talend Open Studio

323

tJavaRow

tJavaRow

Proprits du tJavaRow
Famille de composant Fonction Custom Code Le tJavaRow permet de saisir du code personnalis afin de lintgrer dans le programme Talend. Avec le tJavaRow, vous pouvez saisir le code Java qui va tre appliqu pour chaque ligne du flux. Le tJavaRow permet dtendre les fonctionnalits du Job Talend grce au langage Java. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement : Guide utilisateur de Talend Open Studio. Code Advanced settings Import Saisissez le code Java qui va tre appliqu pour chaque ligne du flux. Saisissez le code Java permettant dimporter, si ncessaire, la librairie externe utilise dans le champ Main code de longlet Basic settings. Cochez cette case pour collecter les donnes de log au niveau du composant.

Objectif Basic settings

tStatCatcher Statistics Utilisation Limitation

Ce composant est utilis en tant que composant de milieu de Job, et doit tre reli un composant de dbut et un composant de sortie. Il est ncessaire de connatre le langage Java.

Scnario associ
Aucun scnario nest disponible pour ce composant.

324

Guide de Rfrence des Composants Talend Open Studio

tLibraryLoad

tLibraryLoad

Proprits du tLibraryLoad
Famille de composant Fonction Objectif Basic settings Custom Code Le tLibraryLoad permet dimporter une librairie. Le tLibraryLoad permet de charger des librairies Java utilisables dans un Job. Library Slectionnez dans la liste la librairie importer, ou cliquez sur le bouton [...] afin de parcourir votre rpertoire et choisir la librairie que vous souhaitez importer. Lib Paths : Saisissez entre guillemets le chemin daccs votre librairie. Saisissez le code Java permettant dimporter, si ncessaire, la librairie externe utilise dans le champ Main code de longlet Basic settings. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Dynamic Libs Import

tStatCatcher Statistics Utilisation

Ce composant peut tre utilis en standalone, mais il est plus logique de lutiliser dans un Job. n/a

Limitation

Scnario : Vrifier le format dune adresse e-mail


Ce scnario comprend deux composants, un tLibraryLoad et un tJava. Le but de ce scnario est de vrifier le format dune adresse e-mail et de retourner si elle est valide ou non.

Dans la Palette, ouvrez le dossier Custom_Code, puis glissez-dposez les composants tLibraryLoad et tJava dans lespace de modlisation graphique. Reliez le tLibraryLoad au tJava laide dun lien Trigger > OnSubjobOk.

Guide de Rfrence des Composants Talend Open Studio

325

Scnario : Vrifier le format dune adresse e-mail

Double-cliquez sur le tLibraryLoad pour afficher sa vue Basic settings. Dans la liste Library, slectionnez jakarta-oro-2.0.8.jar. Dans le champ Import, de longlet Advanced settings, saisissez import org.apache.oro.text.regex.*;

Double-cliquez sur le composant tJava pour afficher sa vue Component. Dans longlet des Basic settings, saisissez votre code, comme dans la capture dcran. Ce code permet de vrifier si une chane de caractres correspond une adresse e-mail, en se basant sur lexpression rgulire suivante : "^[\\w_.-]+@[\\w_.-]+\\.[\\w]+$".

Appuyez sur F6 afin denregistrer et dexcuter votre Job.

La Console affiche false, cest--dire que ladresse e-mail nest pas valide. En effet, son format nest pas correct.

326

Guide de Rfrence des Composants Talend Open Studio

tSetGlobalVar

tSetGlobalVar

Proprits du tSetGlobalVar
Famille de composant Fonction Objectif Basic settings Custom Code Le composant tSetGlobalVar vous permet de dfinir et de configurer les variables globales dans linterface graphique. Le composant tSetGlobalVar simplifie le processus de dfinition des variables globales. Variables Ce tableau contient deux colonnes. Key : Nom de la variable appeler dans le code. Value : la valeur assigne cette variable. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme un sous-job un composant. La connaissance du langage Java est ncessaire.

Scnario : Afficher le contenu dune variable globale


Ce scnario se compose dun Job simple affichant la valeur dune variable globale dfinie dans le composant tSetGlobalVar.

Dposez les composants suivants de la Palette dans lespace de modlisation graphique : tSetGlobalVar et tJava. Reliez le tSetGlobalVar au tJava laide dun lien Trigger > OnSubjobOk. Double-cliquez sur le composant tSetGlobalVar afin dafficher sa vue Basic settings.

Guide de Rfrence des Composants Talend Open Studio

327

Scnario : Afficher le contenu dune variable globale

Cliquez sur le bouton [+] pour ajouter une ligne dans la table Variables, puis renseignez les colonnes Key et Value en saisissant respectivement K1 et 20. Double-cliquez ensuite sur le composant tJava afin dafficher sa vue Basic settings.

Dans la zone Code, saisissez le code suivant : String foo = "bar"; String K1; String Result = "The value is:"; Result = Result + globalMap.get("K1"); System.out.println(Result);

Dans ce scnario, utilisez la variable Result. Pour accder la liste des variables globales, appuyez sur les touches Ctrl + Espace de votre clavier et slectionnez les paramtres correspondants. Sauvegardez votre Job et appuyez sur F6 pour lexcuter.

Le contenu de la variable globale K1 saffiche dans la console.

328

Guide de Rfrence des Composants Talend Open Studio

Composants Data Quality


Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille Data Quality de la Palette de Talend Open Studio. La famille Data Quality regroupe les composants vous permettant damliorer la qualit de vos donnes. Ces composants couvrent divers besoin dont la comparaison de colonnes afin den extraire des donnes spcifiques.

Guide de Rfrence des Composants Talend Open Studio

tAddCRCRow

tAddCRCRow

Proprits du tAddCRCRow
Famille de composant Fonction Objectif Basic settings Data Quality Ce composant calcule une cl de substitution base sur une ou plusieurs colonne(s) et lajoute au schma dfini. Fournir un ID unique afin damliorer la qualit des donnes traites. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Implication Cochez la case correspondant aux colonnes dfinir comme cl de substitution et vrifier l'intgrit de leurs donnes. Slectionnez la longueur CRC. Plus le CRC est long, moins il y aura de risque derreur. Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Advanced settings

CRC type tStatCatcher Statistics

Utilisation Limitation

Ce composant est une tape intermdiaire. Cela requiert un flux entrant et une sortie. n/a

Scnario : Ajouter une cl de substitution un fichier


Ce scnario dcrit un Job ajoutant une cl de substitution un schma de fichier dlimit.

Glissez les composants suivants dans lespace de modlisation: tFileInputDelimited, tAddCRCRow et tLogRow. Connectez-les en utilisant un lien de type Main row.

330

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ajouter une cl de substitution un fichier

Dans la vue Component du tFileInputDelimited, renseignez le champ File Name en saisissant le chemin daccs votre fichier, ainsi que toutes les proprits en rapport, au cas o elles ne soient pas stockes dans le Repository.

Crez le schma en cliquant sur le bouton Edit Schema, si le schma nest pas encore stock dans le Repository. Vrifiez la colonne du type de donnes, et pour remplir le Date pattern, visitez http://java.sun.com/j2se/1.5.0/ docs/api/index.html. [http://java.sun.com/j2se/1.5.0/docs/api/index.html] Dans la vue Component du composant tAddCRCRow, slectionnez les cases de la colonne du flux entrant utiliser pour calculer le CRC.

Notez quune colonne CRC (en lecture seule) a t ajoute la fin du schma. Dans les Advanced settings, slectionnez CRC32 comme CRC Type pour avoir une cl de substitution plus longue.

Dans la vue Basic settings du tLogRow, slectionnez loption Table (print values in cells of a table) pour afficher les donnes de sortie sous forme de tableau dans la Console. Sauvegardez votre Job et appuyer sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

331

Scnario : Ajouter une cl de substitution un fichier

Une colonne CRC supplmentaire a t ajoute au schma, calcule daprs toutes les colonnes prcdemment slectionnes (dans ce cas toutes les colonnes du schma).

332

Guide de Rfrence des Composants Talend Open Studio

tChangeFileEncoding

tChangeFileEncoding

Le tChangeFileEncoding appartient deux familles : Data Quality et File. Pour plus dinformations concernant le composant tChangeFileEncoding, consultez la section intitule tChangeFileEncoding .

Guide de Rfrence des Composants Talend Open Studio

333

tExtractRegexFields

tExtractRegexFields

Le tExtractRegexFields appartient deux familles : Data Quality et Processing. Pour plus dinformations concernant le composant tExtractRegexFields, consultez la section intitule tExtractRegexFields .

334

Guide de Rfrence des Composants Talend Open Studio

tFuzzyMatch

tFuzzyMatch

Proprits du tFuzzyMatch
Famille de composant Fonction Data Quality Le composant tFuzzyMatch compare une colonne du flux principal avec une colonne du flux de rfrence et extrait les donnes du flux principal en affichant la distance. Le tFuzzyMatch permet dassurer la qualit des donnes de nimporte quelle source de donnes en la comparant avec une source de donnes de rfrence. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Deux colonnes en lecture seule sont ajoutes automatiquement au schma de sortie : Value et Match. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Matching type Slectionnez lalgorithme de correspondance appropri parmi les suivants : Levenshtein : Bas sur la thorie de la distance ddition. Il calcule le nombre dinsertion, de suppression ou de substitution ncessaire pour correspondre la rfrence. Metaphone : Bas sur la phontique. Tout dabord, il charge les sonorits de toutes les entres du flux de rfrence (Lookup) et les compare avec celles des entres du flux principal (Main). Double Metaphone : une nouvelle version de lalgorithme phontique Metaphone, qui produit des rsultats plus prcis que lalgorithme original. Il peut retourner la fois un code primaire et secondaire pour une chane de caractres. Pour viter toute ambigut que le Metaphone naurait pas pu dtecter, utilisez cette option. Min distance (Levenshtein uniquement) Dfinissez le nombre minimum de modifications autorises pour correspondre la rfrence. Si vous dfinissez 0, seules les correspondances exactes sont extraites.

Objectif Basic settings

Guide de Rfrence des Composants Talend Open Studio

335

Scnario 1 : Distance de Levenshtein de 0 pour les prnoms

Max distance

(Levenshtein uniquement) Dfinissez le nombre maximum de modificiations pouvant correspondre la rfrence. Slectionnez la colonne du flux principal qui doit tre compare avec la colonne cl du flux de rfrence (Lookup). Cochez cette case pour obtenir la meilleure correspondance possible, si plusieurs correspondances sont disponibles.

Matching column

Unique matching

Matching item separa- Si plusieurs correspondances sont disponibles, elles setor ront toutes affiches sauf si la case Unique match est coche. Dfinissez le dlimiteur entre chaque correspondance. Utilisation Ce composant nest pas un composant de dbut (fond vert) et il ncessite deux composants dentre et un composant de sortie.

Scnario 1 : Distance de Levenshtein de 0 pour les prnoms


Ce scnario dcrit un Job constitu de quatre composants dont le but est de vrifier la distance ddition comprise entre les colonnes First Name (prnom) dun fichier dentre et de comparer les donnes avec celles du fichier de rfrence. Le rsultat de cette vrification de la distance de Levenshtein et le contenu du flux principal sont affichs dans une table.

Cliquez et dposez les composants suivants de la Palette dans lespace de modlisation : tFileInputDelimited (x2), tFuzzyMatch et tFileOutputDelimited. Paramtrez les proprits du composant tFileInputDelimited partir de longlet Basic settings. Parcourez votre rpertoire et slectionnez le fichier dentre analyser. Mais surtout dfinissez le schma utiliser par le flux vrifier. Dans le schma, dfinissez le Type de donnes en version Java, surtout si vous tes en mode Built-in. Connectez ce composant dentre au tFuzzyMatch laide dune connexion de type Main Row. Dfinissez le deuxime composant tFileInputDelimited de la mme manire. Assurez-vous que la colonne de rfrence a bien t dfinie comme colonne cl dans le schma du flux de rfrence (lookup).

336

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Distance de Levenshtein de 0 pour les prnoms

Puis connectez le deuxime composant dentre au tFuzzyMatch laide dune connexion main row (qui apparat comme une connexion Lookup row dans lespace de modlisation). Dfinissez les proprits du tFuzzyMatch dans longlet Basic settings. Le Schma doit correspondre celui du flux dentre principal (Main) afin que le flux principal soit compar au flux de rfrence.

Notez que deux colonnes : Value et Matching sont ajoutes au schma de sortie. Elles correspondent des informations standard de correspondance et sont en lecture seule. Slectionnez la mthode utiliser pour la vrification des donnes entrantes. Dans ce scnario, la correspondance slectionner dans le champ Matching type est de type Levenshtein. Ensuite dfinissez la distance. Dans cette mthode, la distance est le nombre de caractres modifis (insertion, suppression ou substitution) pour que lentre principale corresponde exactement lentre de rfrence.

Dans ce scnario, lobjectif est de faire en sorte que la distance soit de 0 en minimum et en maximum dans les champs Min. distance et Max. distance. Ce qui signifie que seule une correspondance exacte sera redirige en flux de sortie. Dcochez la case Case sensitive pour ne pas prendre en compte la casse. Et dans le champ Matching column, slectionnez la colonne du flux principal qui doit tre vrifie. Dans cet exemple, le prnom (First name). Ne cochez pas la case Unique matching et ne modifiez pas le sparateur. Connectez le tFuzzyMatch un composant de sortie standard type tLogRow. Ne dfinissez aucun autre paramtre que le dlimiteur pour ce scnario.

Guide de Rfrence des Composants Talend Open Studio

337

Scnario 2 : Distance de Levenshtein de 1 ou 2 pour les prnoms

Enregistrez le Job et appuyez sur la touche F6 pour excuter le Job.

Comme la distance ddition dfinie est de 0 (min. et max.), la sortie correspond une jointure entre le flux principal et le flux de rfrence (lookup), ainsi seules les correspondances totales avec une valeur gale 0 sont affiches. Pour un exemple plus vident avec une distance minimum de 1 et une distance maximum de 2, consultez la section intitule Scnario 2 : Distance de Levenshtein de 1 ou 2 pour les prnoms

Scnario 2 : Distance de Levenshtein de 1 ou 2 pour les prnoms


Ce scnario est bas sur le scnario 1 dcrit ci-dessus. Seuls les paramtres distance min. et max. du composant tFuzzyMatch sont modifis, ce qui modifiera la sortie affiche. Dans la vue Component du tFuzzyMatch, modifiez la distance min. de 0 1. Ceci exclut directement les correspondances exactes (qui ont une distance de 0). Maintenant mettez une distance max. de 2 puisque la distance max. ne peut tre infrieure la distance min. La sortie correspond toutes les donnes mises en correspondance contenant une diffrence de 2 caractres au plus.

Aucune autre modification de paramtres nest ncessaire. Assurez-vous que le sparateur de champs (Matching item separator) est bien dfini, vu que plusieurs entres de rfrence peuvent correspondre lentre du flux principal. Enregistrez votre nouveau Job et appuyez sur F6 pour lexcuter.

338

Guide de Rfrence des Composants Talend Open Studio

Scnario 3 : Distance mtaphonique pour les prnoms

Etant donn que la distance ddition a t dfinie 2, certaines entres du flux principal correspondent plusieurs entres de rfrence (lookup). Vous pouvez utiliser une autre mthode, la Mtaphone, pour valuer la distance entre le flux principal et le flux de rfrence.

Scnario 3 : Distance mtaphonique pour les prnoms


Ce scnario est bas sur le scnario 1 dcrit plus haut.

Modifiez le champ Matching type avec loption Metaphone. Aucune distance minimum et aucune distance maximum ne sont dfinir puisque cette mthode est base sur les diffrences de phontique avec la rfrence. Enregistrez le Job et appuyez sur F6. La valeur phontique est affiche avec les correspondances possibles.

Guide de Rfrence des Composants Talend Open Studio

339

tIntervalMatch

tIntervalMatch

Proprits du tIntervalMatch
Famille de composant Fonction Data Quality Le composant tIntervalMatch permet dtablir une jointure entre un flux principal et un flux de rfrence (Java). Il classe une valeur spcifie du flux principal dans la fourchette de valeurs correspondante dfinie dans le flux de rfrence et retourne les informations correspondantes. Il aide retourner une valeur laide dune jointure. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous effectuez des modifications, le schma passera automatiquement en Built-in. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Search column Slectionnez la colonne du flux principal contenant les valeurs qui doivent tre mises en correspondance avec lintervalle de valeurs. Slectionnez la colonne du flux lookup contenant les valeurs qui doivent tre retournes quand la jointure est ok.

Objectif Basic settings

Column (LOOKUP)

Lookup Column min/ Slectionnez la colonne contenant la valeur minimale de bounds strictly (min) lintervalle. Cochez la case si la limite est stricte. Lookup Column max/ Slectionnez la colonne contenant la valeur maximale de bounds strictly (max) lintervalle. Cochez la case si la limite est stricte Advanced settings tStatCatcher Statistics Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation Limitation

Ce composant manipule un flux de donnes, il requiert donc un Input et un Output, et ncessite la dfinition dune tape intermdiaire. n/a

Scnario : Identifier le pays partir de lIP


Dans ce Job, un flux principal entrant transmet un schma deux colonnes: Documents et IP, contenant des donnes factices. Un second fichier est utilis comme flux lookup en Java, et contient une liste classe dintervalles dIP

340

Guide de Rfrence des Composants Talend Open Studio

Scnario : Identifier le pays partir de lIP

ainsi que le pays qui leur correspond. Ce Job a pour but de retrouver les pays de chaque document partir de la valeur de leur IP, en dautres termes, de crer une jointure entre le flux principal et le flux de rfrence.

Le Job requiert un tFileInputDelimited supplmentaire, un tIntervalMatch et un tLogRow. Glissez le composant dans lespace de modlisation. Configurez les paramtres de base dans la vue Component du tFileInputDelimited.

Le schma se compose de deux colonnes, respectivement Document et IP. Configurez la colonne Type en String pour la colonne Document et en Integer pour la colonne IP. Configurez maintenant les proprits du deuxime tFileInputDelimited.

Noubliez pas de dfinir le Type des donnes. Propagez le schma du flux principal entrant au composant tIntervalMatch.

Guide de Rfrence des Composants Talend Open Studio

341

Scnario : Identifier le pays partir de lIP

Notez que le schma Output du composant tIntervalMatch est en lecture seule et est compos du schma de lInput ainsi que dune colonne supplmentaire lookup qui redirigera en sortie les donnes lookup demandes. Configurez les autres proprits du composant tIntervalMatch.

Configurez les autres proprits du tIntervalMatch, notamment les colonnes min et max correspondant aux limites de lintervalle.

Dans le champ Column Lookup, slectionnez la colonne dans laquelle les valeurs devront tre retournes. Dans le champ Search column, slectionnez la colonne du flux principal contenant les valeurs qui devront correspondre aux valeurs de lintervalle. Le composant tLogRow ne requiert pas de configuration particulire pour ce Job. Le rsultat suivant s'affiche:

Seules les valeurs demandes retournes (pays) sont affiches.

342

Guide de Rfrence des Composants Talend Open Studio

tReplaceList

tReplaceList

Proprits du tReplaceList
Famille de composant Fonction Objectif Basic settings Data Quality Le tReplaceList effectue un rechercher/remplacer dans les colonnes dentre spcifies en fonction des donnes de rfrence (lookup). Ce composant permet de nettoyer tous les fichiers avant un traitement futur. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Deux colonnes en lecture seule, Value et Match sont automatiquement ajouts au schma de sortie. Le type de donnes dfini dans les schmas doit tre cohrent, cest--dire quun entier ne peut tre remplac que par un entier en utilisant un entier comme champ de rfrence. Une valeur dun type ne peut tre remplace par une valeur dun autre type. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Lookup search column Saisissez le numro de la colonne sur laquelle effectuer la recherche dans le schma de lookup. 0 : la premire colonne lue 1 : la deuxime colonne lue n : numro de la colonne dans le schma lu. Afin de sassurer que les valeurs cherches sont uniques, assurez-vous que la colonne soit dfinie comme cl dans votre schma de lookup. Lookup replacement co- Saisissez le numro de la colonne dans laquelle les valumn leurs de remplacement sont stockes. 0 : la premire colonne lue 1 : la deuxime colonne lue n : numro de la colonne dans le schma lu Column options Slectionnez les colonnes du flux principal dans lequel le remplacement est effectu.

Guide de Rfrence des Composants Talend Open Studio

343

Scnario : Remplacement partir dun fichier de rfrence

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation

Ce composant est un composant intermdiaire, il ncessite un composant dentre et un composant de sortie.

Scnario : Remplacement partir dun fichier de rfrence


Le Job suivant effectue un rechercher/remplacer sur une liste dEtats avec leur code correspondant. Les codes correspondant sont extraits dun fichier de rfrence plac en flux Lookup dans le Job. Le flux principal est dupliqu et les deux sorties sont affiches dans la console, pour constater ltat du flux principal avant et aprs remplacement.

Cliquez et dposez les composants suivants de la Palette : tMysqlInput, tFileInputDelimited, tReplicate, tReplaceList et tLogRow (x2). Notez que si vos schmas dentre sont dj centraliss sur le Repository, vous pouvez, dun simple cliquer-dposer, les faire passer du noeud correspondant du rpertoire Metadata du Repository vers lespace de modlisation. Cela permettra de rcuprer automatiquement les proprits des composants dentre. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio. Connectez les composants laide de liens Main Row via un clic-droit sur chaque composant. Notez que le lien de type main row provenant du flux de rfrence (tFileInputDelimited) se nomme lookup row. Slectionnez le composant tMysqlInput et dfinissez les paramtres du flux dentre.

Le schma dentre est compos de deux colonnes : Names, States. La colonne States regroupe le nom des Etats des Etats-Unis qui seront remplacs par leur code respectif.

344

Guide de Rfrence des Composants Talend Open Studio

Scnario : Remplacement partir dun fichier de rfrence

Dans le champ Query, assurez-vous que la colonne State est incluse dans la dclaration Select. Dans cet exemple, toutes les colonnes sont slectionnes. Vrifiez les paramtres du composant tReplicate. Le schma est simplement divis en deux flux identiques, mais aucun changement na t effectu sur le schma. Puis double-cliquez sur le composant tFileInputDelimited, pour paramtrer le fichier de rfrence.

Le fichier comporte deux colonnes : Postal et State. Postal correspond au code postal de lEtat de la colonne State correspondante. Les champs sont dlimits par des point-virgules et les lignes par des retours chariot. Modifiez le schma du flux lookup.

Assurez-vous que la colonne lookup sur laquelle est effectue la recherche (dans cet exemple : State) est dfinie comme cl, pour sassurer que les donnes cherches sont uniques. Slectionnez le composant tReplaceList et paramtrez lopration effectuer. Le schma est rcupr partir du composant prcdent dans le flux principal.

Guide de Rfrence des Composants Talend Open Studio

345

Scnario : Remplacement partir dun fichier de rfrence

Dans le champ Lookup search index, renseignez la position de la colonne sur laquelle est effectue la recherche. Dans cet exemple, State est la deuxime colonne du fichier dentre lookup. Ainsi, saisissez 1 dans ce champ. Dans le champ Lookup replacement index, renseignez le numro de la colonne contenant les valeurs de remplacement, dans cet exemple : Postal pour le code postal de lEtat. Dans le tableau Column options, slectionnez la colonne States puisque dans cet exemple le nom des Etats doit tre remplac par leur code correspondant. Pour les deux composants tLogRow, cochez la case Print values in table cells pour que les sorties soient plus claires. Enregistrez le Job et excutez-le en appuyant sur F6.

Le premier flux de sortie affiche la colonne States avec les noms des Etats puisquil provient du flux dentre principal. Le deuxime flux affiche la colonne States aprs que le nom des Etats aient t remplacs par leur codes postaux respectifs.

346

Guide de Rfrence des Composants Talend Open Studio

tSchemaComplianceCheck

tSchemaComplianceCheck

Proprits du tSchemaComplianceCheck
Famille de composant Data Quality Fonction Ce composant valide toutes les lignes dentre en fonction du schma de rfrence ou vrifie le type, la nullabilit, la longueur de la ligne en fonction des valeurs de rfrence. Cette validation peut tre applique lensemble des lignes ou une partie seulement. Le tSchemaComplianceCheck permet dassurer la qualit des donnes de nimporte quelle source de donnes en les comparant aux donnes de rfrence. Base Schema et Edit Un schma est une description de lignes, i.e., il dfinit le schema nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Dfinissez la structure et la nature des donnes traiter. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur Talend Open Studio. Check all columns from Cochez cette option si vous souhaitez effectuer la vrificaschema tion sur toutes les colonnes du schma de base. Custom defined Cochez cette option si vous souhaitez effectuer la vrification sur des colonnes en particulier. Lorsque cette option est coche, le tableau Checked Columns ainsi que la case Trim the excess content of column when length checking chosen and the length is greater than defined length apparaissent. Dfinissez dans ce tableau quelles sont les vrifications effectuer, et sur quelles colonnes. Column :: Affiche les noms des colonnes. Type : slectionnez les proprits que les donnes doivent avoir. Cette validation est obligatoire pour toutes les colonnes. Pour effectuer cette vrification sur toutes les colonnes, cochez la case den-tte du tableau. Date pattern : Dfinissez le format de date souhait sur chaque colonne avec le type de donnes Date. Nullable : Cochez la case de la colonne que vous souhaitez dfinir comme colonne nullable, afin de permettre aux lignes ayant cette colonne vide de se diriger vers le flux de sortie sans tenir compte du schma de base dfini. Pour dfi-

Objectif Basic settings

Checked Columns

Guide de Rfrence des Composants Talend Open Studio

347

Scnario : Valider les dates en fonction dun schma

nir toutes les colonnes comme nullables, cochez la case dentte du tableau. Max length : Cochez la case de la colonne dont vous souhaitez vrifier la longueur des donnes en fonction de la longueur dfinie dans le schma de base. Pour effectuer cette vrification sur toutes les colonnes, cochez la case den-tte du tableau. Trim the excess content of column when length checking chosen and the length is greater than defined length Cochez cette case afin denlever la partie en trop (en fonction de la longueur dfinie) depuis le flux de sortie plutt que de rejeter la ligne quand loption de vrification de la longueur des donnes est coche.

Use another schema for Dfinissez un schma de rfrence en donnant aux donnes compliance check les proprits quelles sont censes avoir. Ainsi, les donnes non conformes seront rejetes. Ces proprits peuvent correspondre au type de donnes, aux valeurs nulles, et/ou la longueur des donnes. Advanced settings Use Fastest Date Check Cochez cette case afin deffectuer une vrification rapide du format de date en utilisant la mthode TalendDate.isDate() de la routine systme TalendDate lorsque Date pattern (format de date) nest pas dfini. Pour plus dinformations concernant les routines, consultez le Guide utilisateur Talend Open Studio. Treat all empty string as Cochez cette case afin de traiter tous les champs vides de NULL chaque colonne comme des valeurs nulles, plutt que comme des chanes de caractres vides. Cette case est coche par dfaut. Lorsquelle est dcoche, le tableau Choose Column(s) saffiche pour vous permettre de slectionner les colonnes que vous souhaitez.. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant intermdiaire permettant dexclure les donnes non conformes du flux principal. Ce composant ne peut tre utilis comme composant de dbut puisquil requiert un flux dentre. Il ncessite aussi au moins un composant de sortie afin de regrouper les flux valids et ventuellement un deuxime pour les donnes rejetes via un lien Rejects. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio.

Scnario : Valider les dates en fonction dun schma


Ce scnario trs basique permet de vrifier le type, la nullabilit et la longueur des donnes du flux dentre en fonction du schma de rfrence dfini. Le flux dentre provient dun fichier csv simple contenant des donnes dont les proprits ont un mauvais type, un mauvais id, dont les donnes sont suprieures la longueur maximum, ou contenant des valeurs nulles dans les colonnes alors que celles-ci sont dfinies comme non nullables.

348

Guide de Rfrence des Composants Talend Open Studio

Scnario : Valider les dates en fonction dun schma

Lors de la validation, les donnes valides ainsi que les donnes rejetes sont affiches respectivement dans deux tableaux de la console.

A partir de la Palette, cliquez et dposez les composants suivants dans lespace de modlisation graphique : tFileInputDelimited, tSchemaComplianceCheck, ainsi que deux composants tLogRow. Cliquez-droit sur le tFileInputDelimited pour le connecter au composant tSchemaComplianceCheck via une connexion Row Main. Cliquez-droit sur le composant tSchemaComplianceCheck et slectionnez Row > Main pour le connecter au premier composant tLogRow. Ce flux de sortie ne contiendra que les donnes valides. Cliquez-droit une deuxime fois sur le composant tSchemaComplianceCheck et cette fois slectionnez Row > Rejects pour le connecter au second composant tLogRow. Cette deuxime sortie regroupera toutes les donnes non conformes. Slectionnez le lien Rejects que vous venez de connecter, vous remarquerez que le schma transmis au second tLogRow contient deux nouvelles colonnes : ErrorCode et ErrorMessage. Ces deux colonnes sont en lecture seule et fournissent des informations sur les donnes rejetes, afin de faciliter le traitement et la correction des erreurs, si ncessaire. Double-cliquez sur le composant tFileInputDelimited afin dafficher sa vue Basic settings.

Guide de Rfrence des Composants Talend Open Studio

349

Scnario : Valider les dates en fonction dun schma

Renseignez le chemin daccs au fichier dentre dans le champ File Name. Spcifiez quelle est la ligne den-tte. Dans ce scnario, il sagit de la premire ligne. Laissez les autres paramtres tels quils sont. Cliquez sur Edit Schema pour dcrire la structure de donnes de ce fichier dentre. Dans ce scnario, le schma est compos de cinq colonnes : ID, Name, BirthDate, State, et City.

Laissez le champ Type aussi permissif que possible. Vous dfinirez le type de donnes rel dans la vue Component du composant tSchemaComplianceCheck. Renseignez le champ Length des colonnes Name, State et City : respectivement 7, 10 et 10. Puis double-cliquez sur le composant tSchemaComplianceCheck pour configurer les paramtres de validation.

350

Guide de Rfrence des Composants Talend Open Studio

Scnario : Valider les dates en fonction dun schma

Cochez loption Custom defined dans la zone Mode pour effectuer des validations personnalises. Dans cet exemple, le tableau Checked columns permet de configurer les paramtres de validations. Cependant, vous pouvez aussi cocher la case Check all columns from schema si vous souhaitez vrifier tous les paramtres de toutes les colonnes (type, valeurs nulles et longueur), en fonction du schma de base dfini, ou encore cocher loption Use another schema for compliance check et dfinir le schma de la structure des donnes souhait. Dans le tableau Checked Columns, dfinissez les vrifications effectuer. Pour ce scnario : - Slectionnez Int comme Type de donnes de la colonne ID. - Cochez la case Length afin que les longueurs des colonnes Name, State et City soient vrifies. - Slectionnez Date comme Type de donnes de la colonne BirthDate, et dd-MM-yyyy comme Date pattern. - Dcochez la case Nullable afin que les valeurs nulles de toutes les colonnes soient vrifies. Pour rejeter les champs dont les donnes sont suprieures la longueur maximum dfinie, assurez-vous que la case Trim the excess content of column when length checking chosen and the length is greater than defined length est dcoche. Dans la vue Advanced settings du composant tSchemaComplianceCheck, cochez la case Treat all empty string as NULL afin de rejeter toutes les lignes contenant des champs vides. Pour visualiser le rsultat du processus de validation sous forme de tableau dans la console Run, double-cliquez sur chaque composant tLogRow et cochez la case Table dans leur vue Basic settings. Enregistrez votre Job et appuyez sur F6 pour lexcuter. Deux tableaux saffichent dans la console, qui montrent respectivement les donnes valides et les donnes rejetes.

Guide de Rfrence des Composants Talend Open Studio

351

Scnario : Valider les dates en fonction dun schma

352

Guide de Rfrence des Composants Talend Open Studio

tUniqRow

tUniqRow

Proprits du tUniqRow
Famille de composant Fonction Objectif Basic settings Data Quality Le composant tUniqRow compare les entres et supprime les doublons du flux dentre. Ce composant assure une qualit de donnes des flux dentre et de sortie du Job. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous effectuez des modifications, le schma passera automatiquement en built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent dans le Job. Si vous souhaitez supprimer les doublons sur des colonnes en particulier, paramtrez-les dans le schma. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Unique key Slectionnez dans cette zone une ou plusieurs colonnes sur lesquelles le ddoublonnage sera effectu. - Cochez la case Key attribute afin deffectuer le ddoublonnage sur toutes les colonnes. - Cochez la case Case sensitive afin de diffrencier les majuscules et les minuscules. Advanced settings Only once each duplica- Cochez cette case si vous souhaitez envoyer uniquement ted key les premires entres en doublon des colonnes dfinies comme cl(s) vers le flux de sortie des doublons. Use of disk (suitable for Cochez cette case pour permettre la gnration de fiprocessing large row chiers temporaires sur le disque dur lors du traitement de set) donnes volumineuses. Cela permet dempcher lchec de lexcution dun Job d un dbordement de la mmoire. Quand cette case est coche, vous devez galement dfinir les lments suivants :

Guide de Rfrence des Composants Talend Open Studio

353

Scnario : Ddoublonner des donnes

- Buffer size in memory: Slectionnez le nombre de lignes mettre en mmoire tampon avant quun fichier temporaire ne soit gnr sur le disque dur. - Directory for temp files: Indiquez lendroit o les fichiers temporaires doivent tre enregistrs. Assurez-vous que le rpertoire indiqu pour vos fichiers temporaires existe, sans quoi lexcution du Job chouera. tStatCatcher Statistics Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation Limitation

Ce composant est un composant intermdiaire puisquil sert traiter un flux de donnes. Ainsi, il ncessite un composant dentre et un composant de sortie. n/a

Scnario : Ddoublonner des donnes


Ce scnario dcrit un Job cinq composants, dont le but est de trier des entres partir dune liste dentre comprenant des noms, de trouver des noms en doublons, et dafficher les noms uniques ainsi que les noms en doublon dans la console Run.

A partir de la Palette, cliquez et dposez les composants suivants dans lespace de modlisation graphique : un tFileInputDelimited, un tSortRow, un tUniqRow, ainsi que deux composants tLogRow, et nommez-les comme illustr ci-dessus. Connectez les composants tFileInputDelimited, tSortRow, et tUniqRow via une connexion de type Row > Main. Connectez ensuite le tUniqRow au premier tLogRow via une connexion Main > Uniques, puis connectez le composant tUniqRow au second tLogRow via une connexion de type Main > Duplicates. Double-cliquez sur le composant tFileInputDelimited afin dafficher longlet Basic settings de sa vue Component.

354

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ddoublonner des donnes

Slectionnez Built-In dans le champ Property Type. Cliquez sur le bouton [...] ct du champ File Name pour slectionner le fichier contenant les donnes dentre. Dfinissez len-tte (Header) et le pied de page (Footer) Dans ce scnario, la ligne den-tte est la premire ligne du fichier dentre. Cliquez sur Edit schema pour dfinir le schma de ce composant. Dans ce scnario, le fichier dentre comprend cinq colonnes : Id, FirstName, LastName, Age, et City. Click ensuite sur OK pour propager le schma et fermer lditeur de schma.

Afin de disposer les entres en fonction de lordre alphabtique des noms, ajoutez deux lignes au tableau Criteria en cliquant sur le bouton [+], slectionnez les colonnes FirstName et LastName sous Schema column, slectionnez le type de tri alphabtique (alpha), puis slectionnez lordre ascendant (asc). Double-cliquez sur le composant tUniqRow afin dafficher longlet Basic settings de sa vue Component.

Guide de Rfrence des Composants Talend Open Studio

355

Scnario : Ddoublonner des donnes

Dans la zone Unique key, slectionnez les colonnes sur lesquelles vous souhaitez effectuer le ddoublonnage. Dans ce scnario, les noms en doublon seront tris. Dans longlet Basic settings de la vue Component des deux composants tLogRow, cochez loption Table afin de visualiser le rsultat de lexcution du Job en mode tableau. Sauvegardez votre Job, puis appuyez sur F6 pour lexcuter. Dans la console Run, les noms uniques et les noms en doublon sont affichs dans des tableaux diffrents.

356

Guide de Rfrence des Composants Talend Open Studio

Composants Databases
Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille Databases de la Palette de Talend Open Studio. La famille Databases regroupe les connecteurs de bases de donnes les plus populaires. Ces connecteurs couvrent divers besoins : ouverture de connexion, lecture et criture de tables, commit de transactions, ainsi que des rollbacks pour le traitement des erreurs. Plus de 40 SGBDR sont supports.

Guide de Rfrence des Composants Talend Open Studio

tAccessBulkExec

tAccessBulkExec

Proprits du tAccessBulkExec
Les composants tAccessOutputBulk et tAccessBulkExec sont gnralement utiliss ensemble pour crire des donnes dans un fichier dlimit puis effectuer diffrentes actions sur le fichier dans une base de donnes Access, processus en deux tapes. Ces deux tapes sont regroupes dans le composant tAccessOutputBulkExec, dtaill dans une section spare. Lintrt dutiliser un processus en deux tapes rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Access Le composant tAccessBulkExec effectue une action dInsert sur les donnes fournies. Le tAccessBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Access Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tAccesstion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. DB Version Database Slectionnez la version dAccess que vous utilisez Nom de la base de donnes.

358

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAccessBulkExec

Username and Pass- Informations dauthentification de lutilisateur de base de word donnes. Action on table Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create table : supprimer la table puis en crer une nouvelle. Create table : crer une table qui nexiste pas encore. Create table if not exists : crer la table si ncessaire. Clear table : supprimer le contenu de la table. Truncate table : supprimer le contenu de la table mais sans possibilit de Rollback. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit exister pour que lopration Insert soit autorise. Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Action on data Vous pouvez effectuer, sur les donnes de la table dfinie, lopration que vous souhaitez : Insert : ajoute de nouvelles entres la table. Schema et Edit Schema Un schma est une description de ligne, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository). Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur Talend Open Studio. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes existante. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Include header tStatCatcher Statistics Usage Cochez cette case pour inclure len-tte des colonnes dans le fichier. Cochez cette case pour collecter les donnes de log au niveau du composant.

Local filename

Ce composant est gnralement utilis avec le composant tAccessOutputBulk. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donns Access.

Guide de Rfrence des Composants Talend Open Studio

359

Scnarios associs

Scnarios associs
Pour plus dinformations relatives au fonctionnement du composant tAccess BulkExec, consultez les scnarios suivants : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du composant tMysqlOutputBulkExec.

360

Guide de Rfrence des Composants Talend Open Studio

tAccessCommit

tAccessCommit

Proprits du tAccessCommit
Ce composant est troitement li aux composants tAccessConnection et tAccessRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Access Le composant tAccessCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tAccessConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tAccessCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Access et notamment avec les composants tAccesConnection et tAccessRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tAccessConnection et tAccessRollback. Ils sont gnralement utiliss avec un composant tAccessConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tAccessCommit, consultez la section intitule Proprits du tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

361

tAccessConnection

tAccessConnection

Proprits du tAccessConnection
Ce composant est troitement li aux composants tAccessCommit, tAccessInput et tAccessoutput. Ils sont gnralement utiliss avec un composant tAccessConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Access Le composant tAccessConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Database Slectionnez la version dAccess que vous utilisez (Access 2003 ou versions suprieures. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant.. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec des composants Access et notamment avec les composants tAccessCommit et tAccessRollback. n/a

Scnario: Insrer des donnes dans des tables parent/enfant


Le Job suivant est ddi des utilisateurs avancs de base de donnes qui souhaitent effectuer des insertions dans des tables multiples en utilisant une table parent Table1 pour gnrer deux tables enfant : Name et Birthday.

362

Guide de Rfrence des Composants Talend Open Studio

Scnario: Insrer des donnes dans des tables parent/enfant

Crez une base de donnes connecte Access 2007 que vous appellerez Database1. Une fois la base de donnes Access cre, crez une table appele Table1 avec les deux en-ttes de colonne suivants : Name et Birthday. Dans Talend Open Studio, le Job est constitu de douze composants, parmi lesquels des composants tAccessConnection, tAccessCommit, tAccessInput, tAccessOutput et tAccessClose.

A partir de la Palette, cliquez et dposez les composants suivants dans lespace de modlisation graphique : tFileList, tFileInputDelimited, tMap, tAccessOutput (x2), tAccessInput (x2), tAccessCommit, tAccessClose et tLogRow (x2). Connectez le composant tFileList au composant dentre tFileInputDelimited laide dune connexion de type Iterate. Ainsi, le nom du fichier traiter sera automatiquement renseign partir de la liste de fichiers du tFileList en utilisant une variable globale. Connectez le composant tFileInputDelimited au tMap et sparez le flux vers les deux composants de sortie tAccessOutput. Utilisez des connexions de type Row pour chacune de ces connexions reprsentant un flux de donnes principal. Dfinissez les proprits du composant tFileList, notamment le rpertoire dans lequel sont stocks les fichiers. Ajoutez le composant tAccessConnection et connectez-le au composant de dpart de ce Job (dans cet exemple, le composant tFileList), laide dune connexion OnComponentOk afin de dfinir lordre dexcution. Dans la vue Component du composant tAccessConnection, dfinissez manuellement les informations de connexion ou rcuprez-les dans le Repository si vous les avez pralablement stockes dans le dossier DB connection du rpertoire Metadata. Pour plus dinformations concernant les Mtadonnes, consultez le Guide utilisateur Talend Open Studio . Dans longlet Basic settings du composant tFileInputDelimited, appuyez sur les touches Ctrl+Espace pour accder la liste des variables. Dfinissez le champ File Name avec la variable globale : tFileList_1.CURRENT_FILEPATH. Pour plus dinformations concernant lutilisation des variables, consultez le Guide Utilisateur Talend Open Studio .

Guide de Rfrence des Composants Talend Open Studio

363

Scnario: Insrer des donnes dans des tables parent/enfant

Paramtrez les autres champs comme vous le souhaitez, dfinissez les sparateurs de lignes et de champs (Row et Field Separator) en fonction de la structure de votre document. Puis dfinissez manuellement le schma du fichier laide du bouton Edit schema ou slectionnez le schma dans le Repository. Assurez-vous que le type de donnes est correctement dfini, conformment la nature des donnes traites. Dans la zone Output du tMap, ajoutez deux tables de sortie, une que vous nommerez Name pour la table Name, et une deuxime que vous nommerez Birthday, pour la table Birthday. Pour plus dinformations concernant le composant tMap, consultez le Guide utilisateur Talend Open Studio. Cliquez sur la colonne Name de la zone Input, et glissez-la dans la table Name. Cliquez sur la colonne Birthday de la zone Input, et glissez-la dans la table Birthday.

Puis slectionnez une connexion de sortie de type Row pour acheminer correctement le flux vers les composants Database de sortie correspondants. Dans longlet Basic settings des deux composants tAccessOutput, cochez la case Use an existing connection pour rcuprer les informations du composant tAccessConnection. Ignorez le champ Commit every puisque cette commande sera annule par le composant tAccessCommit.

Nommez votre table dans le champ Table en vous assurant que vous saisissez la bonne table. Dans cet exemple, la table est soit Name, soit Birthday. Ne dfinissez aucune action dans le champ Action on table puisque les tables ont dj t cres.

364

Guide de Rfrence des Composants Talend Open Studio

Scnario: Insrer des donnes dans des tables parent/enfant

Slectionnez Insert dans le champ Action on data pour les deux composants de sortie (tAccessOutput). Cliquez sur le bouton Sync columns pour rcuprer le schma dfini dans le tMap. Connectez ensuite le premier composant tAccessOutput au premier composant tAccessInput laide dune connexion OnComponentOk. Dans longlet Basic settings des deux composants tAccessInput, cochez la case Use an existing connection pour rcuprer le flux de donnes distribu. Puis dfinissez manuellement le schma du fichier laide du bouton Edit schema. Nommez ensuite votre table dans le champ Table Name. Le nom du tAccessInput_1 sera Name. Cliquez sur Guess Query. Connectez les deux composants tAccessInput au composant tLogRow laide dune connexion de type Row > Main. Dans longlet Basic settings des deux composants tLogRow, slectionnez Table dans le champ Mode. Ajoutez le composant tAccessConnection sous le composant tFileList et connectez-les laide dune connexion OnComponentOk afin darrter le Job avec les commits de transaction. A partir de longlet Basic settings du composant tAccessCommit, slectionnez dans la liste droulante Component list la connexion utiliser, tAccessConnection_1 dans ce scnario. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

La table parent Table1 est utilise la fois pour gnrer la table Name et la table Birthday.

Guide de Rfrence des Composants Talend Open Studio

365

tAccessInput

tAccessInput

Proprits du tAccessInput
Famille de composant Fonction Objectif Databases/Access Le composant tAccessInput lit une base de donnes et en extrait des champs laide de requtes. Le tAccessInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le chapitre le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant tAccesstion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

Basic settings

366

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

miques (Dynamic settings), consultez le Guide utilisateur de votre Studio. DB Version Database Slectionnez la version dAccess que vous utilisez. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository). Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column Utilisation Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL.

Scnarios associs
Pour un scnario associ, consultez les scnarios tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Pour plus dinformations sur les contextes dynamiques dans le cadre dune utilisation de base de donnes, consultez la section intitule tContextLoad .

Guide de Rfrence des Composants Talend Open Studio

367

tAccessOutput

tAccessOutput

Proprits du tAccessOutput
Famille de composant Fonction Objectif Basic settings Databases/Access Le composant tAccessOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tAccessOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio . Use an existing connec- Cochez cette case et slectionnez le composant tAccesstion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio.

368

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAccessOutput

DB Version Database

Slectionnez la version dAccess que vous utilisez. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Guide de Rfrence des Composants Talend Open Studio

369

Proprits du tAccessOutput

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository).

Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tAccessOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. tStatCatcher Statistics Use field options Enable debug mode Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Additional Columns

Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement dune table de base de donnes.

370

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Assurez-vous que la case Nullable est bien coche pour les colonnes du schma correspondantes. Utilisation Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Access. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du tMySQLOutput.

Guide de Rfrence des Composants Talend Open Studio

371

tAccessOutputBulk

tAccessOutputBulk

Proprits du tAccessOutputBulk
Les composants tAccessOutputBulk et tAccessBulkExec sont gnralement utiliss ensemble pour crire des donnes dans un fichier dlimit puis effectuer diffrentes actions sur le fichier dans une base de donnes Access, processus en deux tapes. Ces deux tapes sont regroupes dans le composant tAccessOutputBulkExec, dtaill dans une section spare. Lintrt dutiliser un processus en deux tapes rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Access Le composant tAccessOutputBulk crit un fichier dlimit. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes Access. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement : Guide Utilisateur de Talend Open Studio. Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant (Repository). Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement : Guide utilisateur de Talend Open Studio. Advanced settings Include header Encoding Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

372

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec le composant tAccessBulkExec. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes Access.

Scnarios associs
Pour un scnario associ au tAccessOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

373

tAccessOutputBulkExec

tAccessOutputBulkExec

Proprits du tAccessOutputBulkExec
Les composants tAccessOutputBulk et tAccessBulkExec sont gnralement utiliss ensemble afin dcrire des donnes dans un fichier dlimit, puis deffectuer diffrentes actions sur le fichier dans une base de donnes Access, processus en deux tapes. Ces deux tapes sont regroupes dans le tAccessOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/Access Le tAccessOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tAccessOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Access. Property Type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tAccesstion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. DB Version DB Name Slectionnez la version dAccess que vous utilisez. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes.

374

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAccessOutputBulkExec

Action on table

Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table.

Table

Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dinsert soit autorise. Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio.

File Name

Action on data

Vous pouvez effectuer, sur les donnes de la table dfinie, lopration que vous souhaitez : Insert : ajoute de nouvelles entres la table.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Append Advanced settings Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Include header Encoding Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics

Guide de Rfrence des Composants Talend Open Studio

375

Scnarios associs

Utilisation Limitation

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

Scnarios associs
Pour un scnario associ au tAccessOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

376

Guide de Rfrence des Composants Talend Open Studio

tAccessRollback

tAccessRollback

Proprits du tAccessRollback
Ce composant est troitement li aux composants tAccessConnection et tAccessCommit. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/Access Le tAccessRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tAccessConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants Access, notamment avec le tAccessConnection et le tAccessCommit. n/a

Scnario associ
Pour un scnario associ au tAccessRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMysqlRollback.

Guide de Rfrence des Composants Talend Open Studio

377

tAccessRow

tAccessRow

Proprits du tAccessRow
Famille de composant Fonction Databases/Access tAccessRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tAccessRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tAccesstion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. DB Version Database Slectionnez la version dAccess que vous utilisez. Nom de la base de donnes.

Objectif

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes

378

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAccessRow

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics

Guide de Rfrence des Composants Talend Open Studio

379

Scnarios associs

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du tMySQLRow.

380

Guide de Rfrence des Composants Talend Open Studio

tAS400Close

tAS400Close

Proprits du tAS400Close
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/AS400 Le composant tAS400Close ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes AS400. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tAS400Connection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tAS400Connection et tAS400Rollback. Il est gnralement utilis avec un composant tAS400Connection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant, consultez la section intitule tMysqlConnection du composant tAS400Close.

Guide de Rfrence des Composants Talend Open Studio

381

tAS400Commit

tAS400Commit

Proprits du tAS400Commit
Ce composant est troitement li aux composants tAS400Connection et tAS400Rollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/AS400 Le composant tAS400Commit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tAS400Connection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tAS400Commit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants AS400 et notamment avec les composants tAS400Connection et tAS400Rollback. n/a

Scnario associ
Ce composant est troitement li aux composants tAS400Connection et tAS400Rollback. Ils sont gnralement utiliss avec un composant tAS400Connection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tAS400Commit, consultez la section intitule Proprits du tMysqlCommit

382

Guide de Rfrence des Composants Talend Open Studio

tAS400Connection

tAS400Connection

Proprits du tAS400Connection
Ce composant est troitement li aux composants tAS400Commit et tAS400Rollback. Ils sont gnralement utiliss avec un composant tAS400Connection car il permet douvrir une connexion pour la transaction en cours.

Famille de composant Fonction Objectif Basic settings

Databases/AS400 Le composant tAS400Connection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Host Database Table Schema Slectionnez la version dAS400 que vous utilisez. Adresse IP du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant.. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants AS400 et notamment avec les composants tAS400Commit et tAS400Rollback. n/a

Guide de Rfrence des Composants Talend Open Studio

383

Scnario associ

Scnario associ
Ce composant est troitement li aux composants tAS400Commit et tAS400Rollback. Ils sont gnralement utiliss avec un composant tAS400Connection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tAS400Connection, consultez la section intitule tMysqlConnection

384

Guide de Rfrence des Composants Talend Open Studio

tAS400Input

tAS400Input

Proprits du tAS400Input
Famille de composant Fonction Objectif Databases/AS400 Le composant tAS400Input lit une base de donnes et en extrait des champs laide de requtes. Le tAS400SInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Use an existing connec- Cochez cette case et slectionnez le composant tion tAS400SInput adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

385

Scnarios associs

Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. DB Version Host Port Database Slectionnez la version dAS400 que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL.

Scnarios associs
Pour un scnario associ, consultez les scnarios du composant tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

386

Guide de Rfrence des Composants Talend Open Studio

tAS400LastInsertId

tAS400LastInsertId

Proprits du tAS400LastInsertId
Famille de composant Fonction Objectif Basic settings Databases/AS400 Le tAS400LastInsertId affiche les derniers ID ajouts une table partir dune connexion AS400 spcifie. Le composant tAS400LastInsertId permet de rcuprer les cls primaires des entres dernirement ajoutes par un utilisateur une table AS400. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Component list Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tAS400Connection dans la liste sil y a plus dune connexion dans votre Job. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant intermdiaire. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Rcuprer les ID des dernires entres ajoutes du composant tMysqlLastInsertId.

Guide de Rfrence des Composants Talend Open Studio

387

tAS400Output

tAS400Output

Proprits du tAS400Output
Famille de composant Fonction Objectif Basic settings Databases/AS400 Le composant tAS400Output crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tAS400Output excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio . DB Version Slectionnez la version dAS400 que vous utilisez. Use an existing connec- Cochez cette case et slectionnez le composant tion tAS400SOutput adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

388

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAS400Output

miques (Dynamic settings), consultez le Guide utilisateur de votre Studio Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crire. Notez quune seule table peut tre crite la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme ma-

Guide de Rfrence des Composants Talend Open Studio

389

Proprits du tAS400Output

nire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide Utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Cochez cette case pour accder au champ Commit every et dfinir les oprations de commit. Commit every : nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de transaction (cependant pas de rollback) et surtout une meilleure performance des excutions. Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Additional Columns Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tAS400Output peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes.

Advanced settings

Use commit control

390

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes AS400. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour des scnarios associs, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMySQLOutput.

Guide de Rfrence des Composants Talend Open Studio

391

tAS400Rollback

tAS400Rollback

Proprits du tAS400Rollback
Ce composant est troitement li aux composants tAS400Commit et tAS400Connection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/AS400 Le tAS400Rollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tAS400Connection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants AS400, notamment avec le tAS400Connection et le tAS400Commit. n/a

Scnario associ
Pour un scnario associ au tAS400Rollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMySQLRollback.

392

Guide de Rfrence des Composants Talend Open Studio

tAS400Row

tAS400Row

Proprits du tAS400Row
Famille de composant Fonction Databases/AS400 tAS400Row est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tAS400Row agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Use an existing connec- Cochez cette case et slectionnez le composant tion tAS400Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Host Port Database Slectionnez la version dAS400 que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

393

Proprits du tAS400Row

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Additional JDBC Para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance.

394

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Commit every

Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log lors du traitement du Job, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

395

tCreateTable

tCreateTable

Proprits du tCreateTable
Ce composant se trouve la racine de la famille Databases de la Palette de Talend Open Studio. Le composant tCreateTable couvre des besoins indirectement lis lutilisation des bases de donnes de tout type. Famille de composant Fonction Objectif Basic settings Databases Le tCreateTable cre, supprime ou supprime et recre une table spcifique. Ce composant permet de crer ou de supprimer nimporte quelle table dune base de donnes Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Database Type Slectionnez le type de SGBD dans la liste propose. Les proprits peuvent diffrer lgrement en fonction du type de base de donnes slectionn. Les champs additionnels sont dfinis dans ce tableau, la suite des proprits gnrales. Table Action Slectionnez laction effectuer sur la base de donnes : Create table : lorsque vous savez que la table nexiste pas dj. Create table when not exists : lorsque vous ne savez pas si la table existe dj. Drop and create table : lorsque vous savez que la table existe dj et que vous souhaitez la remplacer. Mysql Temporary Table Cochez cette case pour enregistrer la table cre de manire temporaire.

MSSQLServer, MyS- Use an existing connec- Cochez cette case si vous utilisez un composant de QL, Oracle, PostgresPlus, tion connexion, par exemple : tMysqlConnection ou tOraclePostgresql, Teradata Connection, etc. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de

396

Guide de Rfrence des Composants Talend Open Studio

Proprits du tCreateTable

Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Oracle Connection Type Liste droulante des pilotes disponibles: Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur un systme. Service Oracle : Slectionnez ce type de connexion pour utiliser lalias TNS que vous fournissez lorsque vous vous connectez la base de donnes distante. Oracle OCI : Slectionnez ce type de connexion pour utiliser linterface dappel de la base de donnes Oracle (Oracle Call Interface) accompagne dun ensemble de logiciels API de langage C qui fournissent une interface cette base de donnes Oracle. WALLET : Slectionnez ce type de connexion pour stocker les informations didentification dans un portefeuille Oracle (Oracle wallet). Access Access File Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Firebird Firebird File Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Interbase Interbase File Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. SQLite SQLite File Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Java Db HSQLDb HSQLDb AS400/Oracle Framework Type Running Mode Use TLS/SSL Sockets DB Version Slectionnez dans la liste un framework pour votre base de donnes Java. Slectionnez dans la liste le type de serveur correspondant aux paramtres de votre base de donnes. Cochez cette case pour autoriser, si besoin, le mode scuris. Slectionnez dans la liste droulante la version correspondant la base de donne slectionne.

Guide de Rfrence des Composants Talend Open Studio

397

Proprits du tCreateTable

Teradata

Create

Slectionnez la table partir de la liste droulante. La table crer peut tre : -SET TABLE : table ne permettant pas de dupliquer les lignes -MULTI SET TABLE : table permettant de dupliquer les lignes.

Tous les types de bases de Host donnes, excepts Access, JavaDb, SQLite et ODBC Tous les types de bases Database Name de donnes, excepts Access, Firebird, HSQLDb, SQLite et ODBC JavaDb DB Root Path

Adresse IP du serveur de base de donnes.

Nom de la base de donnes.

Parcourez vos fichiers jusqu la racine de votre base de donnes. Numro du port dcoute du serveur de base de donnes.

Tous les types de bases Port de donnes, excepts Access, AS400, Firebird, Interbase, JavaDb, SQLite et ODBC HSQLDb Informix ODBC DB Alias DB Server ODBC Name

Nom de la base de donnes. Nom du serveur de base de donnes. Nom de la base de donnes.

UserName et Password Informations dauthentification de lutilisateur de base de donnes. Table name Saisissez le nom de la nouvelle table entre guillemets. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings tStatCatcher Statistics Cochez cette case pour collecter les donnes de log lors du traitement du Job, aussi bien au niveau du Job quau niveau de chaque composant.

AS400/ MSSQL Server Utilisation

Additional JDBC Para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Ce composant offre la flexibilit des requtes de base de donnes et couvre toutes les possibilits des requtes SQL. Plus de scnarios sont disponibles pour chaque composant dentre de type base de donnes.

398

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer une nouvelle table dans une base de donnes MySQL

Scnario : Crer une nouvelle table dans une base de donnes MySQL
Le Job dcrit ci-dessous a t conu pour crer une nouvelle table dans une base de donnes, compose dun schma pris partir du schma dun fichier dlimit stock dans le Repository. Ce Job est compos dun seul composant.

Cliquez et dposez un composant tCreateTable de la famille Databases de la Palette. Dans la liste Database type de longlet Basic settings de la vue Component, slectionnez MySQL.

Dans la liste droulante Table Action, slectionnez Create table. Ne cochez la case Use Existing Connection uniquement si vous utilisez un composant avec une connexion ddie (pour plusd'informations, consultez la section intitule tMysqlConnection ). Vous nutiliserez pas cette option pour cet exemple. Dans la liste droulante Property type, slectionnez Repository, ainsi tous les champs de connexion la base de donnes sont renseigns automatiquement. Si vous navez pas configur de connexion aux bases de donnes dans le dossier Metadata du rpertoire DB connection, renseignez manuellement ces informations de connexion aprs avoir slectionn Built-in dans la liste droulante Property type. Dans le champ Table Name, saisissez le nom de la nouvelle table crer. Si vous souhaitez rcuprer le schma dune mtadonne (sans que celle-ci ne soit une connexion une base de donnes), slectionnez Repository puis la mtadonne souhaite. Dans tous les cas (Built-in ou Repository), cliquez sur Edit Schema pour vrifier le type de donnes dans la colonne DB Type.

Guide de Rfrence des Composants Talend Open Studio

399

Scnario : Crer une nouvelle table dans une base de donnes MySQL

Cliquez sur le bouton Reset DB Types si la colonne DB type est vide ou affiche des marques de diffrence (couleur orange). Cela permet de donner nimporte quel type de donnes, le type de donnes adquat. Cliquez sur OK. Enregistrez votre Job appuyez sur F6 pour lexcuter. La table cre est vide mais elle contient toutes les colonnes dfinies dans le Schma.

400

Guide de Rfrence des Composants Talend Open Studio

tDB2BulkExec

tDB2BulkExec

Proprits du tDB2BulkExec
Famille de composant Fonction Objectif Basic settings Databases/DB2 Le composant tDB2BulkExec excute des oprations dInsert sur les donnes fournies. Le tDB2BulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes DB2. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tJDBCtion Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Table Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification sur lutilisateur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

401

Proprits du tDB2BulkExec

Table Action on table

Nom de la table crire. Notez quune seule table peut tre crite la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Data file Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une cl de recherche sur laquelle baser les oprations Update et Delete. Il est possible de dfinir les colonnes qui agiront comme cl de recherche partir du schma, pour une utilisation de base, ou partir des options avances (Advanced settings) pour une utilisation optimise de ces oprations.

402

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Advanced settings

Field terminated by Date Format Time Format Timestamp Format Remove Load Pending Load options

Caractre, chane ou expression rgulire sparant les champs. Utilisez ce champ pour dfinir lordre des mois et des jours. Utilisez ce champ pour dfinir lordre des heures, minutes et secondes. Utilisez ce champ pour dfinir lordre de la date et de lheure. Quand la case est coche, dbloque la table en tat Pending, aprs un chargement massif. Cliquez sur le bouton [+] afin dajouter des options de chargement des donnes. Parameter : dans la liste, slectionnez un paramtre de chargement. Value : saisissez une valeur pour le paramtre slectionn.

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes DB2.

Scnario associ
Pour un scnario associ au composant tDB2BulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

403

tDB2Close

tDB2Close

Proprits du tDB2Close
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/DB2 Le composant tDB2Close ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes DB2. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tDB2Connection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tDB2Connection et tDB2Rollback. Il est gnralement utilis avec un composant tDB2Connection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tDB2Close, consultez la section intitule tMysqlConnection

404

Guide de Rfrence des Composants Talend Open Studio

tDB2Commit

tDB2Commit

Proprits du tDB2Commit
Ce composant est troitement li aux composants tDB2Connection et tDB2Rollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/DB2 Le composant tDB2Commit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tDB2Connection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tDB2Commit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants DB2 et notamment tDB2Connection et tDB2Rollback. n/a

Scnario associ
Ce composant est troitement li aux composants tDB2Connection et tDB2Rollback. Ils sont gnralement utiliss avec un composant tDB2Connection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tDB2Commit, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

405

tDB2Connection

tDB2Connection

Proprits du tDB2Connection
Ce composant est troitement li aux composants tDB2Commit et tDB2Rollback. Ils sont gnralement utiliss avec un composant tDB2Connection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/DB2 Le composant tDB2Connection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier une fois quil est valid en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Table Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes.

Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants DB2, notamment les composants tDB2Commit et tDB2Rollback. n/a

406

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Scnarios associs
Pour un scnario associ au composant tDB2Connection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

Guide de Rfrence des Composants Talend Open Studio

407

tDB2Input

tDB2Input

Proprits du tDB2Input
Famille de composant Fonction Purpose Databases/DB2 Le composant tDB2Input lit une base de donnes et en extrait des champs laide de requtes. Le tDB2Input excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez un composant tion tDB2Input.

Basic settings

Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

408

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

miques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur dannuaire DB2. Numro du port dcoute du serveur. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type et Query Nom de la table source dans laquelle capturer les changements apports aux donnes. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes DB2.

Scnarios associs
Pour un scnario associ, consultez les scnarios du composant tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

Guide de Rfrence des Composants Talend Open Studio

409

tDB2Output

tDB2Output

Proprits du tDB2Output
Famille de composant Fonction Objectif Basic settings Databases/DB2 Le composant tDB2Output crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tDB2Output excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Use an existing connec- Cochez cette case lorsque vous utilisez un composant tion tDB2Output. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Host Adresse IP du serveur de base de donnes.

410

Guide de Rfrence des Composants Talend Open Studio

Proprits du tDB2Output

Port Database

Numro du port dcoute du serveur. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crire. Notez quune seule table peut tre crite la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete. Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Guide de Rfrence des Composants Talend Open Studio

411

Proprits du tDB2Output

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide Utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de transaction (cependant pas de rollback) et surtout une meilleure performance des excutions. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tDB2Output peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes.

Advanced settings

Commit every

Additional Columns

Convert columns and Cochez cette case pour mettre le nom des colonnes et celui table names to upper- de la table en majuscules. case Enable debug mode Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement dune table de base de donnes. Assurez-vous que la case Nullable est bien coche pour les colonnes du schma correspondantes. Use Batch size Cochez cette case afin dactiver le mode batch pour le traitement des donnes. Dans le champ Batch Size qui apparat, vous pouvez saisir le nombre de lignes par lot charger.

412

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Cette case est disponible uniquement si vous avez choisi loption Insert, Update, Single Insert Query ou Delete dans le champ Action on data. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes DB2. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au composant tDB2Output, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du tMySQLOutput.

Guide de Rfrence des Composants Talend Open Studio

413

tDB2Rollback

tDB2Rollback

Proprits du tDB2Rollback
Ce composant est troitement li aux composants tDB2Commit et tDB2Connection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/DB2 Le tDB2Rollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tDB2Connection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants DB2, notamment avec le tDB2Connection et le tDB2Commit. n/a

Scnario associ
Pour un scnario associ au tDB2Rollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMySQLRollback.

414

Guide de Rfrence des Composants Talend Open Studio

tDB2Row

tDB2Row

Proprits du tDB2Row
Famille de composant Fonction Databases/DB2 tDB2Row est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tDB2Row agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Use an existing connec- Cochez cette case et slectionnez le composant tion tDB2Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

415

Proprits du tDB2Row

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution.

Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance.

416

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ au composant tDB2Row, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

417

tDB2SCD

tDB2SCD

Le composant tDB2SCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tDB2SCD .

418

Guide de Rfrence des Composants Talend Open Studio

tDB2SCDELT

tDB2SCDELT

Le composant tDB2SCDELT appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tDB2SCDELT .

Guide de Rfrence des Composants Talend Open Studio

419

tDB2SP

tDB2SP

Proprits du tDB2SP
Famille de composant Fonction Objectif Basic settings Databases/DB2 Le composant tDB2SP appelle une procdure stocke de base de donnes. Le tDB2SP permet de centraliser des requtes multiples ou complexes dans une base de donnes et de les appeler plus facilement. Use an existing connec- Cochez cette case et slectionnez le composant tion tDB2Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier des proprits du composant. Les champs suivants sont alors pr-remplis. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification sur lutilisateur de base de donnes. Schema et Edit Schema Dans une procdure stocke, le schma est un paramtre dentre.

420

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il est rutilisable. Voir galement le Guide utilisateur de Talend Open Studio. SP Name Saisissez le nom exact de la Procdure Stocke (SP). Is Function / Return re- Cochez cette case, si une seule valeur doit tre retourne. sult in Slectionnez dans la liste la colonne du schma sur laquelle est base la valeur obtenir. Parameters Cliquez sur le bouton [+] et slectionnez dans le champ Schema Columns les diffrentes colonnes ncessaires la procdure. Notez que le schma de la SP peut contenir plus de colonnes quil ny a de paramtres utiliss dans la procdure. Slectionnez le Type de paramtre : IN : paramtre dentre (Input) OUT : paramtre de sortie (Output)/valeur retourne IN OUT : les paramtres dentre doivent tre retournes sous forme de valeur, mme aprs modifications via la procdure (fonction). RECORDSET : les paramtres dentre doivent tre retournes sous forme densemble de valeurs, au lieu dune valeur unique. Consultez la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut. Dans ce cas, seuls les paramtres dentre sont autoriss. La syntaxe de la Procdure Stocke doit correspondre celle de la base de donnes.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Excuter une procdure stocke dans le hub MDM du composant tMysqlSP. Consultez galement la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL.

Guide de Rfrence des Composants Talend Open Studio

421

tDBInput

tDBInput

Proprits du tDBInput
Famille de composant Fonction Objectif Databases/DB Generic Le composant tDBInput lit une base de donnes et en extrait des champs laide de requtes. Le tDBInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Prfrez toujours un composant Input spcifique au composant gnrique Basic settings Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Connection type Database Liste droulante des pilotes disponibles. Nom de la base de donnes

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder.

422

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Afficher les donnes slectionnes partir dune table

Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma.

Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL grce une connexion gnrique ODBC.

Scnario 1 : Afficher les donnes slectionnes partir dune table


Le Job suivant, deux composants, lit les donnes dune base via une requte et affiche dans la console (vue Run) les donnes dlimites.

Cliquez et dposez les composants tDBInput et tLogRow dans lditeur graphique. Cliquez droit sur le tDBInput et, en gardant le bouton droit enfonc, glissez jusquau tLogRow pour crer une connexion de type Main Row. Slectionnez nouveau le tDBInput pour que la vue Component apparaisse puis renseignez les proprits du composant :

Dans ce scnario, le champ Property Type est en mode Built-In.

Guide de Rfrence des Composants Talend Open Studio

423

Scnario 2 : Utiliser la variable StoreSQLQuery

Renseignez les informations de connexion la base de donnes dans les champs Database, Username et Password. Le champ Schema est en mode Built-In, ce qui implique que le schma ne sera utilisable que pour ce Job et sur ce poste. Cliquez sur le bouton Edit Schema et rpertoriez les codes des magasins dans une colonne et les ventes dans une autre. Renseignez le nom de la table dans le champ Table Name. Saisissez la requte excuter en veillant ce que l'ordre des colonnes correspondent celui fourni dans le schma. Dans cet exemple, comme toutes les colonnes du schma ont t slectionnes, il est possible dutiliser lastrisque. De la mme faon, cliquez sur le deuxime composant pour le dfinir. Indiquez quel est le sparateur de champs : il sagit ici dune barre verticale. Passez sur la vue Run et cliquez sur le bouton Run pour excuter le Job. La base de donnes est alors analyse. Les donnes recherches sont extraites et sont affiches directement sur la console (vue Run), o vous pouvez les voir.

Scnario 2 : Utiliser la variable StoreSQLQuery


La variable StoreSQLQuery peut tre utilise pour dboguer un scnario tDBInput qui ne sexcuterait pas correctement. Elle permet dalimenter la requte de votre composant tDBInput de manire dynamique. Partez du scnario 1 dcrit ci-dessus, auquel vous ajouterez un composant tJava. Reliez les composants tDBInput et tJava via une connexion Trigger de type OnComponentOk. Dans le cas prsent, faites en sorte que la commande du tDBInput sexcute avant la commande du tJava.

424

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Utiliser la variable StoreSQLQuery

Configurez les composants tDBInput et tLogRow comme dans le scnario 1 dcrit plus haut. Passez la vue appele Context. Crez un nouveau paramtre que vous appellerez StoreSQLQuery et donnez-lui une valeur de 1 par dfaut. Cette valeur indique que StoreSQLQuery est valide (true) et pourra tre utilis par la variable globale QUERY. Cliquez sur le composant tJava et affichez la vue Component. Tapez la commande System.Out.println() pour afficher le contenu de la requte, puis, dans les parenthses, appuyez sur Ctrl+Espace pour accder la liste des variables, et slectionnez la variable globale QUERY.

Affichez la vue Run et excutez les Jobs. La requte associe au composant tDBInput saffiche dans la console (vue Run), la fin des rsultats du Job :

Guide de Rfrence des Composants Talend Open Studio

425

tDBOutput

tDBOutput

Proprits du tDBOutput
Famille de composant Fonction Objectif Databases Le composant tDBOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tDBOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Prfrez toujours un composant Output spcifique au composant gnrique. Basic settings Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Connection type Database Liste des pilotes disponibles. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on data Nom de la table crire. Notez quune seule table peut tre crite la fois. Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre.

426

Guide de Rfrence des Composants Talend Open Studio

Proprits du tDBOutput

Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete. Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Clear data in table Cochez cette case pour que les donnes soient supprimes de la table slectionne avant toute action.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de transaction (cependant pas de rollback) et surtout une meilleure performance des excutions. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence.

Advanced settings

Commit every

Additional Columns

Guide de Rfrence des Composants Talend Open Studio

427

Scnario : Afficher la base de donnes en sortie

Reference column : Saisissez une colonne de rfrence que le composant tDBOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnario : Afficher la base de donnes en sortie


Le Job suivant, form de trois composants, permet de crer une nouvelle table dans une base de donne dtermine et de lalimenter. Le composant tFileInputdelimited passe le flux entrant au composant tDBOutput. En outre, le composant tLogRow est utilis ici pour afficher les rsultats directement dans la console de la vue Run.

Cliquez et dposez les trois composants ncessaires pour ce Job. Dfinissez les paramtres dentre pour le composant tFileInputDelimited, dans longlet Basic settings. Dans cet exemple, le fichier contient les identifiants des propritaires, les rfrences des marques, des couleurs et des immatriculations des voitures. Ces informations sont organises comme suit : un point-virgule comme sparateur de champ et un retour chariot comme sparateur de ligne. Le fichier dentre comprend une ligne dentte prendre en compte dans le schma. Si ce fichier est dj dcrit dans vos mtadonnes, vous pouvez en rcuprer les proprits en slectionnant lentre correspondante dans le Repository.

Si votre schma est dj stock dans le Repository, slectionnez loption Repository dans le champ Schema puis choisissez les mtadonnes appropries partir de la liste. Si vous navez encore dfini aucun schma, renseignez la structure des donnes dans un schma que vous crerez en mode built-in. Pour ce cas de figure, rduisez lextraction 10 lignes. Dfinissez ensuite le composant tDBOutput pour configurer le flux de sortie. Slectionnez la base de donnes laquelle se connecter. Vous pouvez stocker lensemble des dtails de connexion aux bases de donnes via

428

Guide de Rfrence des Composants Talend Open Studio

Scnario : Afficher la base de donnes en sortie

diffrentes variables de contexte. Pour plus dinformations sur la manire de crer et dutiliser les variables de contexte, consultez le Guide utilisateur de Talend Open Studio.

Renseignez le nom de la table dans le champ Table, puis choisissez les oprations effectuer : Dans le champ Action on table, slectionnez loption Drop and create table partir de la liste, ce qui vous permettra dcraser la table, si elle existe, avec les nouvelles donnes choisies. Vous pouvez galement ajouter des lignes supplmentaires dans une table dj existante, mais notez que la gestion des doublons nest pas supporte nativement. consultez la section intitule Proprits du tUniqRow pour plus dinformations. Dans le champ Action on data, slectionnez loption Insert. Le flux de donnes entrant sera alors ajout la table slectionne. Pour visualiser plus facilement le flux sortant, connectez le composant tDBOuput un composant tLogRow. Dfinissez le symbole barre verticale comme sparateur de champ. Appuyez sur F6 pour excuter le Job. Le traitement peut prendre un peu de temps avant que le tLogRow n'affiche le rsultat. Pour afficher le suivi du traitement, activez la fonction Statistics sur la console de la vue Run.

Sujet associ : la section intitule Proprits du tMysqlOutput Proprits du tMysqlOutput, page 678

Guide de Rfrence des Composants Talend Open Studio

429

tDBSQLRow

tDBSQLRow

Proprits du tDBSQLRow
Famille de composant Fonction Databases/DB Generic tDBSQLRow est le composant gnrique tout type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Pour une question de performances, prfrez toujours un composant de base de donnes spcifique au composant gnrique. Objectif Selon la nature de la requte et de la base de donnes, tDBSQLRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Datasource Nom de la source de donnes ODBC crer au pralable pour pouvoir se connecter la base de donnes Pour plus dinformations, consultez le prrequis de ce tableau. Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Table Name Query type Nom de la table de base de donnes modifier. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement.

Basic settings

430

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rinitialiser lauto-incrmentation dune base de donnes

Query

Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma.

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL. Utilisez le composant DBRow correspondant au type de base de donnes dont vous vous servez. La plupart des bases de donnes ont leur propre composant DBRow spcifique.

Prrequis

ODBC (Open DataBase Connectivity) est un protocole standard permettant d'accder aux informations de serveurs de bases de donnes. Vous devez pralablement crer une source de donnes (datasource) ODBC et la relier votre base de donnes pour en lire les informations. Pour crer une source ODBC sous Windows, par exemple, allez Panneau de configuration > Outils dadministration > Sources de donnes (OBCD) puis renseignez les proprits de la source partir de lassistant.

Scnario : Rinitialiser lauto-incrmentation dune base de donnes


Le Job suivant, un seul composant, permet de rinitialiser lauto-incrmentation de la base de donnes (valeur initiale = 1). Il ne permet pas de gnrer un flux en sortie car il est gnralement utilis avant lexcution dun script.

Guide de Rfrence des Composants Talend Open Studio

431

Scnario : Rinitialiser lauto-incrmentation dune base de donnes

Glissez-dposez le composant tDBSQLRow sur lespace graphique de modlisation. Dans la vue Basic settings, renseignez les proprits de la connexion la source de donnes (datasource) ODBC. Pour plus dinformations sur les sources de donnes OBCD, consultez concernant les prrequis dans le tableau des proprits.

Dans le champ Property Type, slectionnez Repository pour rcuprer les informations connexion stockes dans le Repository. Dans le champ Datasource, saisissez le nom de la source de donnes ODBC laquelle est relie la base de donnes contenant la table dont vous voulez rinitialiser lauto-incrmentation. Dans les champs Username et Password, renseignez si ncessaire vos identifiant et mot de passe de connexion la source de donnes. Dans le champ Schema Type, slectionnez le mode Built-in et dcrivez la structure de la base de donnes Talend. Le schma nest pas important dans notre cas particulier puisque vous souhaitez rinitialiser lautoincrmentation de la table et que vous ne touchez pas aux donnes. Dans le champ Table Name, renseignez le nom de la table dont vous voulez rinitialiser lauto-incrmentation. Dans le champ Query type, laissez loption Built-in. Cliquez sur le bouton [...] ct du champ Edit schema pour ouvrir le SQLbuilder. Sinon, saisissez le code suivant : Alter table <TableName> auto_increment = 1 directement dans le champ Query. Enregistrez le Job et appuyez sur F6 pour lexcuter. Lauto-incrmentation de la base de donnes est rinitialise. Voir galement : la section intitule Proprits du tMysqlRow .

432

Guide de Rfrence des Composants Talend Open Studio

tEXAInput

tEXAInput

Proprits du tEXAInput
Famille de composant Fonction Objectif Databases/EXA Le composant tEXAInput lit une base de donnes et en extrait des champs laide de requtes. Le tEXAInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Host name Port Schema name Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Saisissez le nom du schma.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Table Name Query type et Query Saisissez le nom de la table. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Guide de Rfrence des Composants Talend Open Studio

433

Scnarios associs

Guess Query

Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Cliquez sur le bouton pour rcuprer le schma de la table.

Guess schema Advanced settings

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes EXA.

Scnarios associs
Consultez les scnarios associs au composant tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery .

434

Guide de Rfrence des Composants Talend Open Studio

tEXAOutput

tEXAOutput

Proprits du tEXAOutput
Famille de composant Fonction Objectif Basic settings Databases/EXA Le composant tEXAOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tEXAOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Host Port Schema name Adresse IP du serveur de base de donnes. Numro de port dcoute du serveur. Saisissez le nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne :

Guide de Rfrence des Composants Talend Open Studio

435

Proprits du tEXAOutput

Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Cochez cette case afin de dfinir, dans le champ Commit every, qui apparat alors, le nombre de lignes traiter avant de commiter.

Advanced settings

Use commit control

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies.

436

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Additional Columns

Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tEXAOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier.

Use field options Enable debug mode tStatCatcher Statistics Utilisation

Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes EXA. Il permet aussi de crer un flux de rejet avec un lien Row > Rejects filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

437

tEXARow

tEXARow

Proprits du tEXARow
Famille de composant Fonction Databases/EXA tEXARow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tEXARow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Schema name Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Saisissez le nom du schma.

Objectif

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Guess Query Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query.

438

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Query

Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

439

tEXistConnection

tEXistConnection

Proprits du tEXistConnection
Ce composant est troitement li aux tEXistGet et tEXistPut. Une fois que vous avez dfini les proprits de connexion du composant, vous pouvez rutiliser cette connexion sans avoir dfinir nouveau les proprits pour chaque composant tEXist utilis dans le Job. Famille de composant Fonction Objectif Basic settings Databases/eXist Le tEXistConnection ouvre une connexion une base de donnes eXist afin deffectuer une transaction. Ouvrir une connexion une base de donnes eXist afin deffectuer une transaction. URI Collection Driver URI de la base de donnes laquelle vous souhaitez vous connecter. Saisissez le chemin daccs la collection laquelle vous souhaitez accder, sur le serveur de la base de donnes. Ce champ est automatiquement rempli. Par dfaut, le nom du pilote standard saffiche. Les utilisateurs peuvent spcifier un pilote diffrent, selon leurs besoins. Username et Password Informations dauthentification de lutilisateur de base de donnes. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants tEXist,comme le tEXistGet et le tEXistPut. La base de donnes eXist est un systme de gestion de base de donnes open source, construit laide de la technologie XML. Elle stocke des donnes XML selon le modle de donnes XML et offre une fonction efficace de traitement de la requte XQuery, base sur lindex. Pour plus dinformations concernant XQuery, consultez : http://exist.sourceforge.net/xquery.html (en anglais). Pour plus dinformations concernant les extensions de XQuery Update, consultez : http:// exist.sourceforge.net/update_ext.html n/a

Limitation

Scnario associ
Ce composant est gnralement utilis avec un tEXistGet et un tEXistPut. Il nest pas trs pertinent dutiliser un de ces composants sans utiliser un tEXistConnection pour ouvrir une connexion pour la transaction. Pour un scnario associ au tEXistConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille du composant tMysqlConnection.

440

Guide de Rfrence des Composants Talend Open Studio

tEXistDelete

tEXistDelete

Proprits du tEXistDelete
Famille de composant Fonction Objectif Basic settings Databases/eXist Ce composant supprime des ressources dune base de donnes eXist. Le tEXistDelete supprime des ressources spcifies dans une base de donnes eXist distante. Use an existing connec- Cochez cette case et slectionnez le composant tEXisttion/Component List Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. URI Collection URI de la base de donnes laquelle vous souhaitez vous connecter. Saisissez le chemin daccs la collection laquelle vous souhaitez accder, sur le serveur de la base de donnes. Ce champ est automatiquement rempli. Par dfaut, le nom du pilote standard saffiche. Les utilisateurs peuvent spcifier un pilote diffrent, selon leurs besoins. Username et Password Informations dauthentification de lutilisateur de base de donnes. Target Type Slectionnez le type de cible :

Driver

Guide de Rfrence des Composants Talend Open Studio

441

Scnario associ

Resource(Ressource), Collection (Collection), ou All (Tous). Files Cliquez sur le bouton [+] afin dajouter les lignes que vous souhaitez utiliser comme filtres : Filemask : saisissez le nom du fichier ou le masque de fichier, en utilisant des caractres de remplacement (*) ou des expressions rgulires. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis en tant que sous-job ou comme composant de sortie. La base de donnes eXist est un systme de gestion de base de donnes open source, construit laide de la technologie XML. Elle stocke des donnes XML selon le modle de donnes XML et offre une fonction efficace de traitement de la requte XQuery, base sur lindex. Pour plus dinformations concernant XQuery, consultez : http://exist.sourceforge.net/xquery.html (en anglais). Pour plus dinformations concernant les extensions de XQuery Update, consultez : http://exist.sourceforge.net/update_ext.html n/a

Limitation

Scnario associ
Aucun scnario nest disponible pour ce composant.

442

Guide de Rfrence des Composants Talend Open Studio

tEXistGet

tEXistGet

Proprits du tEXistGet
Famille de composant Fonction Objectif Basic settings Databases/eXist Le composant tEXistGet rcupre des ressources partir dun serveur distant de base de donnes eXist. Le tEXistGet tlcharge les ressources slectionnes partir dun serveur distant de base de donnes dans un rpertoire local. Use an existing connec- Cochez cette case et slectionnez le composant tEXisttion/Component List Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. URI Collection URI de la base de donnes laquelle vous souhaitez vous connecter. Saisissez le chemin daccs la collection laquelle vous souhaitez accder, sur le serveur de la base de donnes. Ce champ est automatiquement rempli. Par dfaut, le nom du pilote standard saffiche. Les utilisateurs peuvent spcifier un pilote diffrent, selon leurs besoins. Username et Password Informations dauthentification de lutilisateur de base de donnes.

Driver

Guide de Rfrence des Composants Talend Open Studio

443

Scnario : Rcuprer des ressources partir dun serveur distant de base de donnes eXist

Local directory Files

Chemin daccs au fichier de destination. Cliquez sur le bouton [+] afin dajouter les lignes que vous souhaitez utiliser comme filtres : Filemask : saisissez le nom du fichier ou le masque de fichier, en utilisant des caractres de remplacement (*) ou des expressions rgulires.

Advanced settings Utilisation

tStatCatcher Statistics

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis en tant que sous-job ou comme composant de sortie. La base de donnes eXist est un systme de gestion de base de donnes open source, construit laide de la technologie XML. Elle stocke des donnes XML selon le modle de donnes XML et offre une fonction efficace de traitement de la requte XQuery, base sur lindex. Pour plus dinformations concernant XQuery, consultez : http://exist.sourceforge.net/xquery.html (en anglais). Pour plus dinformations concernant les extensions de XQuery Update, consultez : http:// exist.sourceforge.net/update_ext.html [http://exist.sourceforge.net/xquery.html] n/a

Limitation

Scnario : Rcuprer des ressources partir dun serveur distant de base de donnes eXist
Ce scnario dcrit un Job un composant qui permet de rcuprer des donnes partir dun serveur de base de donnes eXist et de tlcharger les donnes dans un rpertoire local. Ce Job simple ncessite un composant : le tEXistGet.

A partir de la Palette, dposez le composant tEXistGet dans lespace de modlisation graphique. Double-cliquez sur le composant tEXistGet pour dfinir ses proprits dans longlet Basic settings de sa vue Component.

444

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer des ressources partir dun serveur distant de base de donnes eXist

Renseignez le champ URI en saisissant ladresse URI de la base de donnes eXist laquelle vous souhaitez vous connecter. Dans ce scnario, lURI est xmldb:exist://192.168.0.165:8080/exist/xmlrpc. Notez que cette adresse URI est destine essentiellement la dmonstration et que ce nest pas une adresse valide. Remplissez le champ Collection avec le chemin daccs la collection souhaite sur le serveur de la base de donnes, /db/talend dans ce scnario. Renseignez le champ Driver en saisissant le pilote de la base de donnes XML, org.exist.xmldb.DatabaseImpl dans ce scnario. Remplissez les champs Username et Password avec admin et talend respectivement pour ce scnario. Cliquez sur le bouton [...] ct du champ Local directory pour dfinir le chemin daccs au rpertoire dans lequel le fichier XML tlcharg partir du serveur de la base de donnes sera sauvegard. Dans ce scnario, faites pointer ce chemin vers votre bureau, par exemple : C:/Documents and Settings/galano/Desktop/ExistGet. Dans le champ Files, cliquez sur le bouton [+] afin dajouter une nouvelle ligne dans la zone Filemask et remplissez-la avec un nom de fichier complet pour rcuprer les donnes partir dun fichier spcifique sur le serveur, ou avec un masque de fichier (filemask) pour rcuprer les donnes partir dun ensemble de fichiers. Dans ce scnario, saisissez dictionary_en.xml. Sauvegardez votre Job et appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

445

Scnario : Rcuprer des ressources partir dun serveur distant de base de donnes eXist

Le fichier XML dictionary_en.xml est rcupr et tlcharg dans le rpertoire local dfini pralablement.

446

Guide de Rfrence des Composants Talend Open Studio

tEXistList

tEXistList

Proprits du tEXistList
Famille de composant Fonction Objectif Basic settings Databases/eXist Ce composant liste les ressources stockes sur un serveur distant de base de donnes. Le tEXistList liste les ressources stockes sur un serveur distant de base de donnes. Use an existing connec- Cochez cette case et slectionnez le composant tEXisttion/Component List Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. URI Collection URI de la base de donnes laquelle vous souhaitez vous connecter. Saisissez le chemin daccs la collection laquelle vous souhaitez accder, sur le serveur de la base de donnes. Ce champ est automatiquement rempli. Par dfaut, le nom du pilote standard saffiche. Les utilisateurs peuvent spcifier un pilote diffrent, selon leurs besoins. Username et Password Informations dauthentification de lutilisateur de base de donnes.

Driver

Guide de Rfrence des Composants Talend Open Studio

447

Scnario associ

Files

Cliquez sur le bouton [+] afin dajouter les lignes que vous souhaitez utiliser comme filtres : Filemask : saisissez le nom du fichier ou le masque de fichier, en utilisant des caractres de remplacement (*) ou des expressions rgulires.

Target Type

Slectionnez le type de cible : Resource(Ressource), Collection (Collection), ou All (Tous).

Advanced settings Utilisation

tStatCatcher Statistics

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec un tEXistGet afin de rcuprer les fichiers lists, par exemple. La base de donnes eXist est un systme de gestion de base de donnes open source, construit laide de la technologie XML. Elle stocke des donnes XML selon le modle de donnes XML et offre une fonction efficace de traitement de la requte XQuery, base sur lindex. Pour plus dinformations concernant XQuery, consultez : http://exist.sourceforge.net/xquery.html (en anglais). Pour plus dinformations concernant les extensions de XQuery Update, consultez : http://exist.sourceforge.net/update_ext.html n/a

Limitation

Scnario associ
Pour un scnario associ au tEXistList , consultez la section intitule Scnario : Itration sur un rpertoire distant .

448

Guide de Rfrence des Composants Talend Open Studio

tEXistPut

tEXistPut

Proprits du tEXistPut
Famille de composant Fonction Objectif Basic settings Databases/eXist Ce composant charge des ressources dans un serveur de base de donnes. Le tEXistPut charge des fichiers spcifis dun rpertoire local dfini sur un serveur distant de base de donnes. Use an existing connec- Cochez cette case et slectionnez le composant tEXisttion/Component List Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. URI Collection URI de la base de donnes laquelle vous souhaitez vous connecter. Saisissez le chemin daccs la collection laquelle vous souhaitez accder, sur le serveur de la base de donnes. Ce champ est automatiquement rempli. Par dfaut, le nom du pilote standard saffiche. Les utilisateurs peuvent spcifier un pilote diffrent, selon leurs besoins. Username et Password Informations dauthentification de lutilisateur de base de donnes. Local directory Chemin daccs au fichier de destination.

Driver

Guide de Rfrence des Composants Talend Open Studio

449

Scnario associ

Files

Cliquez sur le bouton [+] afin dajouter les lignes que vous souhaitez utiliser comme filtres : Filemask : saisissez le nom du fichier ou le masque de fichier, en utilisant des caractres de remplacement (*) ou des expressions rgulires.

Advanced settings Utilisation

tStatCatcher Statistics

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis en tant que sous-job ou comme composant de sortie. La base de donnes eXist est un systme de gestion de base de donnes open source, construit laide de la technologie XML. Elle stocke des donnes XML selon le modle de donnes XML et offre une fonction efficace de traitement de la requte XQuery, base sur lindex. Pour plus dinformations concernant XQuery, consultez : http://exist.sourceforge.net/xquery.html (en anglais). Pour plus dinformations concernant les extensions de XQuery Update, consultez : http://exist.sourceforge.net/update_ext.html n/a

Limitation

Scnario associ
Aucun scnario nest disponible pour ce composant.

450

Guide de Rfrence des Composants Talend Open Studio

tEXistXQuery

tEXistXQuery

Proprits du tEXistXQuery
Famille de composant Fonction Objectif Basic settings Databases/eXist Ce composant utilise des fichiers locaux contenant des requtes XPath afin dinterroger des fichiers XML stocks dans une base de donnes distante. Le tEXistXQuery excute une requte sur des fichiers XML stocks sur une base de donnes distante, et crit les rsultats dans un fichier XML stock localement. Use an existing connec- Cochez cette case et slectionnez le composant tEXisttion/Component List Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. URI Collection URI de la base de donnes laquelle vous souhaitez vous connecter. Saisissez le chemin daccs la collection laquelle vous souhaitez accder, sur le serveur de la base de donnes. Ce champ est automatiquement rempli. Par dfaut, le nom du pilote standard saffiche. Les utilisateurs peuvent spcifier un pilote diffrent, selon leurs besoins. Username et Password Informations dauthentification de lutilisateur de base de donnes.

Driver

Guide de Rfrence des Composants Talend Open Studio

451

Scnario associ

XQuery Input File Local Output Advanced settings Utilisation tStatCatcher Statistics

Parcourez votre rpertoire jusquau fichier local contenant la requte excuter. Parcourez votre rpertoire jusqu lemplacement o les rsultats de la requte doivent tre sauvegards. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est utilis en tant que composant unique dun Job mais peut galement tre utilis dans un Job plus complexe. La base de donnes eXist est un systme de gestion de base de donnes open source, construit laide de la technologie XML. Elle stocke des donnes XML selon le modle de donnes XML et offre une fonction efficace de traitement de la requte XQuery, base sur lindex. Pour plus dinformations concernant XQuery, consultez : http://exist.sourceforge.net/ xquery.html (en anglais). Pour plus dinformations concernant les extensions de XQuery Update, consultez : http://exist.sourceforge.net/update_ext.html [http:// exist.sourceforge.net/xquery.html] n/a

Limitation

Scnario associ
Aucun scnario nest disponible pour ce composant.

452

Guide de Rfrence des Composants Talend Open Studio

tEXistXUpdate

tEXistXUpdate

Proprits du tEXistXUpdate
Famille de composant Fonction Objectif Basic settings Databases/eXist Ce composant traite des fichiers XML et met jour les enregistrements sur un serveur de base de donnes. Le tEXistXUpdate traite des fichiers XML et met jour les enregistrements existants sur un serveur de base de donnes. Use an existing connec- Cochez cette case et slectionnez le composant tEXisttion/Component List Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. URI Collection URI de la base de donnes laquelle vous souhaitez vous connecter. Saisissez le chemin daccs la collection laquelle vous souhaitez accder, sur le serveur de la base de donnes. Ce champ est automatiquement rempli. Par dfaut, le nom du pilote standard saffiche. Les utilisateurs peuvent spcifier un pilote diffrent, selon leurs besoins. Username et Password Informations dauthentification de lutilisateur de base de donnes.

Driver

Guide de Rfrence des Composants Talend Open Studio

453

Scnario associ

Update File

Parcourez votre rpertoire jusquau fichier local utiliser pour mettre jour les enregistrements de la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant est utilis en tant que composant unique dun Job mais peut galement tre utilis dans un Job plus complexe. La base de donnes eXist est un systme de gestion de base de donnes open source, construit laide de la technologie XML. Elle stocke des donnes XML selon le modle de donnes XML et offre une fonction efficace de traitement de la requte XQuery, base sur lindex. Pour plus dinformations concernant XQuery, consultez : http://exist.sourceforge.net/ xquery.html (en anglais). Pour plus dinformations concernant les extensions de XQuery Update, consultez : http://exist.sourceforge.net/update_ext.html n/a

Limitation

Scnario associ
Aucun scnario nest disponible pour ce composant.

454

Guide de Rfrence des Composants Talend Open Studio

tFirebirdClose

tFirebirdClose

Proprits du tFirebirdClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Firebird Le composant tFirebirdClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Firebird. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tFirebirdConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tFirebirdConnection et tFirebirdRollback. Il est gnralement utilis avec un composant tFirebirdConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tFirebirdClose, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

455

tFirebirdCommit

tFirebirdCommit

Proprits du tFirebirdCommit
Ce composant est troitement li aux composants tFirebirdConnection et tFirebirdRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Firebird Le composant tFirebirdCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tFirebirdConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tFireBirdCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Firebird et notamment avec les composants tFirebirdConnection et tFirebirdRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tFirebirdConnection et tFirebirdRollback. Ils sont gnralement utiliss avec un composant tFirebirdConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tFirebirdCommit, consultez la section intitule tVerticaConnection .

456

Guide de Rfrence des Composants Talend Open Studio

tFirebirdConnection

tFirebirdConnection

Proprits du tFirebirdConnection
Ce composant est troitement li aux composants tFirebirdCommit et tFirebirdRollback. Ils sont gnralement utiliss avec un composant tFirebirdConnection car il permet douvrir une connexion pour la transaction en cours.

Famille de composant Fonction Objectif Basic settings

Databases/Firebird Le composant tFirebirdConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier une fois quil est valid en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Table Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants Firebird, notamment les composants tFirebirdCommit et tFirebirdRollback. n/a

Guide de Rfrence des Composants Talend Open Studio

457

Scnario associ

Scnario associ
Pour un scnario associ au composant tFirebirdConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

458

Guide de Rfrence des Composants Talend Open Studio

tFirebirdInput

tFirebirdInput

Proprits du tFirebirdInput
Famille de composant Fonction Objectif Databases/Firebird Le composant tFirebirdInput lit une base de donnes et en extrait des champs laide de requtes. Le tFirebirdInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Firebird.

Guide de Rfrence des Composants Talend Open Studio

459

Scnarios associs

Scnarios associs
Pour un scnario associ, consultez les scnarios associs au composant gnrique tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

460

Guide de Rfrence des Composants Talend Open Studio

tFirebirdOutput

tFirebirdOutput

Proprits du tFirebirdOutput
Famille de composant Fonction Objectif Basic settings Databases/Firebird Le composant tFirebirdOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tFirebirdOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Adresse IP du serveur de base de donnes. Numro de port dcoute du serveur. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes.

Guide de Rfrence des Composants Talend Open Studio

461

Proprits du tFirebirdOutput

Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete. Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de transaction (cependant pas de rollback) et surtout une meilleure performance des excutions. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes.

Advanced settings

Commit every

Additional Columns

462

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tFirebirdOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement dune table de base de donnes. Assurez-vous que la case Nullable est bien coche pour les colonnes du schma correspondantes. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Firebird. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

463

tFirebirdRollback

tFirebirdRollback

Proprits du tFirebirdRollback
Ce composant est troitement li aux composants tFirebirdCommit et tFirebirdConnection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/Firebird Le tFirebirdRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tFirebirdConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants Firebird, notamment avec le tFirebirdConnection et le tFirebirdCommit. n/a

Scnario associ
Pour un scnario associ au tFirebirdRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMysqlRollback.

464

Guide de Rfrence des Composants Talend Open Studio

tFirebirdRow

tFirebirdRow

Proprits du tFirebirdRow
Famille de composant Fonction Databases/Firebird tFirebirdRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tFirebirdRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tFirebirdtion Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Database Adresse IP du serveur de base de donnes. Nom de la base de donnes.

Objectif

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

465

Proprits du tFirebirdRow

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics

466

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

467

tGreenplumBulkExec

tGreenplumBulkExec

Proprits du tGreenplumBulkExec
Les composants tGreenplumOutputBulk et tGreenplumBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tGreenplumOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Greenplum Le composant tGreenplumBulkExec effectue une action dInsert sur les donnes fournies. Le tGreenplumBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Greenplum. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tGreenplumConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

468

Guide de Rfrence des Composants Talend Open Studio

Proprits du tGreenplumBulkExec

Schema

Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. File Name Nom du fichier traiter. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Advanced settings Action on data Slectionnez lopration que vous voulez effectuer : Bulk insert Bulk update Les informations demandes seront diffrentes en fonction de laction choisie. Copy the OID for each Rcupre les identifiants dobjet pour chaque ligne. row Contains a header line Spcifiez que la table contient des lignes den-tte. with the names of each column in the file File type Null string Fields terminated by Escaped char Text enclosure Slectionnez le type de fichiers traiter. Chane de caractres affiche pour signifier que la valeur est nulle. Caractre, chane ou expression rgulire sparant les champs. Caractre dchappement de la ligne. Caractres utiliss pour entourer le texte.

Action on table

Force not null for co- Dfinissez la nullabilit des colonnes lumns Force not null : Cochez la case correspondant la colonne (Column) que vous souhaitez dfinir comme ntant pas nulle. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec un composant tGreenplumOutputBulk. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes Greenplum. n/a

Limitation

Guide de Rfrence des Composants Talend Open Studio

469

Scnarios associs

Scnarios associs
Pour plus dinformations relatives au fonctionnement de tGreenplumBulkExec, consultez les scnarios suivants, dans : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du composant tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du composant tOracleBulkExec.

470

Guide de Rfrence des Composants Talend Open Studio

tGreenplumClose

tGreenplumClose

Proprits du tGreenplumClose
Famille de composant Fonction Objectif Basic settings Databases/Greenplum Le composant tGreenplumClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Greenplum. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tGreenplumConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tGreenplumConnection et tGreenplumRollback. Il est gnralement utilis avec un composant tGreenplumConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tGreenplumClose, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

471

tGreenplumCommit

tGreenplumCommit

Proprits du tGreenplumCommit
Ce composant est troitement li aux composants tGreenplumConnection et tGreenplumRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Greenplum Le composant tGreenplumCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tGreenplumConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tGreenplumCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Close connection

Ce composant est gnralement utilis avec des composants Greenplum et notamment avec les composants tGreenplumConnection et tGreenplumRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tGreenplumConnection et tGreenplumRollback. Ils sont gnralement utiliss avec un composant tGreenplumConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tGreenplumCommit, consultez la section intitule tMysqlConnection .

472

Guide de Rfrence des Composants Talend Open Studio

tGreenplumConnection

tGreenplumConnection

Proprits du tGreenplumConnection
Ce composant est troitement li aux composants tGreenplumCommit et tGreenplumRollback. Ils sont gnralement utiliss avec un composant tGreenplumConnection car il permet douvrir une connexion pour la transaction en cours.

Famille de composant Fonction Objectif Basic settings

Databases/Greenplum Le composant tGreenplumConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier une fois quil est valid en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants Greenplum, notamment les composants tGreenplumCommit et tGreenplumRollback. n/a

Guide de Rfrence des Composants Talend Open Studio

473

Scnarios associs

Scnarios associs
Pour un scnario associ au composant tGreenplumConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

474

Guide de Rfrence des Composants Talend Open Studio

tGreenplumInput

tGreenplumInput

Proprits du tGreenplumInput
Famille de composant Fonction Objectif Databases/ Greenplum Le composant tGreenplumInput lit une base de donnes et en extrait des champs laide de requtes. Le tGreenplumInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tGreenplumConnection. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Guide de Rfrence des Composants Talend Open Studio

475

Scnarios associs

Advanced settings

Use cursor

Cochez cette case et dfinissez le nombre de lignes avec lesquelles vous souhaitez travailler en une fois. Cette option permet doptimiser les performances.

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Utilisation Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Greenplum.

Scnarios associs
Pour un scnario associ, consultez les scnarios des composants tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

476

Guide de Rfrence des Composants Talend Open Studio

tGreenplumGPLoad

tGreenplumGPLoad

Ce composant invoque lutilitaire gpload de Greenplum afin dinsrer des enregistrements dans une base de donnes Greenplum. Ce composant peut tre utilis soit en mode standalone, il chargera alors les donnes partir dun fichier de donnes existant, soit connect un flux dentre, afin de charger des donnes partir du composant connect.

Proprits du tGreenplumGPLoad
Famille de composant Fonction Objectif Databases/Greenplum Le composant tGreenplumGPLoad insre des donnes dans la table dune base de donnes Greenplum via lutilitaire gpload de Greenplum. Ce composant permet de charger en masse des donnes dans une table Greenplum soit partir dun fichier, soit partir dun flux dentre, soit partir dun tube nomm. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table dans laquelle les donnes doivent tre insres. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne, avant de charger les donnes : None : neffectuer aucune opration de table. Clear table : supprimer le contenu de la table. Create table : crer une table qui nexiste pas encore. Create table if not exists : crer la table si ncessaire. Drop and create the table : supprimer la table puis en crer une nouvelle. Drop table if exists and create : supprimer la table si elle existe dj et la (re)cre. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Guide de Rfrence des Composants Talend Open Studio

477

Proprits du tGreenplumGPLoad

Action on data

Vous pouvez effectuer diffrentes actions sur les donnes de la table dfinie : Insert : Ajouter de nouvelles entres la table. Si des doublons sont trouvs, le Job sarrte. Update : Apporter des modifications aux entres existantes. Merge : Mettre jour ou ajouter des donnes dans la table. Il est ncessaire de spcifier au moins une colonne comme tant une cl primaire sur laquelle baser les oprations Update et Merge . Vous pouvez le faire en cliquant sur Edit Schema et en cochant la (les) case(s) ct de la (des) colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour configurer les options des oprations Update et Merge , cochez les cases de la colonne Match Column correspondant aux noms des colonnes que vous souhaitez utiliser comme base pour les oprations Update et Merge . Ensuite, cochez les cases de la colonne Update Column correspondant aux noms des colonnes que vous souhaitez mettre jour. Pour configurer le champ Update condition , saisissez la condition qui sera utilise pour mettre jour les donnes.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Data file Chemin daccs complet au fichier de donnes utiliser. Si ce composant est utilis seul (non connect un autre composant par un flux dentre), alors saisissez le nom dun fichier existant charger dans la base de donnes. Sil est connect un autre composant par un flux dentre, saisissez le nom du fichier gnrer et crire avec les donnes dentre, afin de lutiliser plus tard avec gpload pour charger dans la base de donnes. Ce champ est masqu lorsque la case Use named-pipe est coche. Cochez cette case afin dutiliser un tube nomm la place dun fichier de donnes. Cette option ne peut tre utilise que lorsque le composant est connect un autre composant par un flux dentre. Quand la case est coche, aucun fichier de donnes nest gnr, et les donnes sont transfres lutilitaire gpload via un tube nomm. Cette option amliore grandement les performances sous Linux et Windows.

Use named-pipe

478

Guide de Rfrence des Composants Talend Open Studio

Proprits du tGreenplumGPLoad

Ce composant, en mode tube nomm, utilise une interface JNI pour crer un tube nomm et crire dedans, dans toute plateforme Windows. Le chemin daccs associ au fichier DLL JNI doit tre configur dans le chemin daccs la bibliothque Java. Le composant est automatiquement fourni dans le Studio avec deux DLL pour les systmes dexploitation de 32 et 64 bits. Named-pipe name Die on error Spcifiez un nom pour le tube nomm utiliser. Vrifiez que le nom saisi est valide. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Use existing control file Cochez cette case pour fournir un fichier de contrle (YAML formatted) utiliser avec lutilitaire gpload au lieu de spcifier explicitement toutes les options dans le composant. Lorsque cette case est coche, loption Data file ainsi que les autres options lies lutilitaire gpload ne sappliquent plus. Veuillez vous rfrer au manuel du gpload de Greenplum pour plus dinformations concernant la cration dun fichier de contrle. Control file Saisissez le chemin daccs au fichier de contrle utiliser, entre guillemets doubles, ou cliquez sur le bouton [...] afin de parcourir votre rpertoire jusquau fichier de contrle. Cette option est passe lutilitaire gpload via largument -f. Cochez cette case pour inclure des paramtres spcifiques au format CSV, tels que Escape char et Text enclosure. Caractre, chane de caractres ou expression rgulire utilis pour sparer les champs. Argument delim de lutilitaire gpload. La valeur par dfaut est |. Pour amliorer les performances, utilisez la valeur par dfaut. Escaped char Text enclosure Caractre dchappement de la ligne. Caractres utiliss pour entourer le texte.

CSV mode Field separator

Header (skips the first Cochez cette case pour ignorer la premire ligne du fichier row of data file) de donnes. Additional options Dfinissez les arguments gpload dans le tableau correspondant. Cliquez sur le bouton [+] autant de fois que ncessaire afin dajouter les arguments au tableau. Cliquez sur le champ Parameter et choisissez largument souhait dans la liste, puis cliquez sur le champ Value correspondant et saisissez une valeur entre guillemets. LOCAL_HOSTNAME : Nom de lhte ou adresse IP de la machine sur laquelle gpload fonctionne. Si cette machine est configure avec plusieurs cartes rseau, vous pouvez spcifier le nom de lhte ou ladresse IP de chaque carte rseau, afin de permettre au trafic dutiliser simultanment toutes les cartes rseau. Par dfaut, lhte local ou adresse IP principal(e) est utilis(e).

Guide de Rfrence des Composants Talend Open Studio

479

Proprits du tGreenplumGPLoad

PORT (gpfdist port) : Numro du port spcifique devant tre utilis par le programme de distribution du fichier gpfdist. Vous pouvez galement renseigner PORT_RANGE afin de slectionner un port disponible dans lcart spcifi. Si PORT et PORT_RANGE sont spcifis, PORT prvaut. Si aucun des deux nest dfini, un port disponible entre 8000 et 9000 est slectionn par dfaut. Si plusieurs noms dhtes sont dclars dans LOCAL_HOSTNAME, le numro du port est utilis pour tous les htes. Cette configuration est souhaite si vous voulez utiliser toutes les cartes rseau pour charger le mme fichier ou le mme ensemble de fichiers dans un rpertoire donn. PORT_RANGE : Peut tre utilis la place de PORT (gpfdist port) afin de spcifier une plage de numros de ports parmi lesquels gpload peut choisir un port disponible pour cette instance du programme de distribution du fichier gpfdist. NULL_AS : Chane de caractres reprsentant une valeur null. La valeur par dfaut est \N en mode TEXT et une valeur vide sans guillemet en mode CSV. Tout lment de donnes source correspondant cette chane de caractres sera considr comme valeur null. FORCE_NOT_NULL : En mode CSV, traite chaque colonne spcifie comme si elle tait entoure de guillemets et ntait donc pas une valeur NULL. Pour la chane de caractres null par dfaut en mode CSV (aucun caractre entre deux dlimiteurs), cela cre des valeurs manquantes valuer comme des chanes de caractres de longueur zro. ERROR_LIMIT (2 or higher) : Active le mode disolation dune ligne pour cette opration de chargement. Lorsquil est activ et que le nombre maximal derreurs nest pas atteint pour les instances de segments Greenplum durant le traitement de lentre, toutes les lignes correctes sont charges et les lignes ayant des erreurs de format sont rejetes ou enregistres dans la table ERROR_TABLE, si elle est disponible. Si le nombre limite derreurs est atteint, les lignes dentre ayant des erreurs de format arrtent lopration de chargement. Notez que lisolation dune ligne en erreur sapplique uniquement aux lignes de donnes ayant des erreurs de format, par exemple, des attributs manquants ou supplmentaires, des attributs dun mauvais type de donnes ou des squences dencodage client invalides. Des erreurs de contraintes, telles que les violations de cl primaire, provoquent toujours larrt du chargement. Lorsque cette option nest pas active, lopration de chargement sarrte la premire erreur rencontre. ERROR_TABLE : Lorsque la limite ERROR_LIMIT est dclare, spcifie une table derreur dans laquelle les lignes contenant des erreurs de format sont enregistres lors de lexcution en mode isolation dune ligne. Vous

480

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

pouvez observer cette table derreurs afin de voir les lignes en erreur nayant pas t charges (sil y en a). Log file Encoding Specify gpload path Parcourez votre systme ou saisissez le chemin daccs votre fichier de log. Saisissez le type dencodage dans le champ. Cochez cette case afin de spcifier le chemin daccs complet lexcutable gpload. Vous devez cocher cette case si le chemin daccs nest pas spcifi dans la variable denvironnement PATH.

Full path to gpload exe- Chemin daccs complet lexcutable gpload sur la macutable chine en cours dutilisation. Il est recommand de spcifier le chemin daccs dans la variable denvironnement PATH au lieu de slectionner cette option. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est principalement utilis lorsque des transformations particulires ne sont pas requises sur les donnes charger dans la base de donnes. Ce composant peut tre utilis en standalone ou en tant que composant de sortie.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Insrer des donnes dans une base MySQL du composant tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

481

tGreenplumOutput

tGreenplumOutput

Proprits du tGreenplumOutput
Famille de composant Fonction Objectif Basic settings Databases/Greenplum Le composant tGreenplumOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tGreenplumOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tGreenplumConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Adresse IP du serveur de base de donnes.

482

Guide de Rfrence des Composants Talend Open Studio

Proprits du tGreenplumOutput

Port Database Schema

Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Guide de Rfrence des Composants Talend Open Studio

483

Scnarios associs

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tPostgresqlOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Commit every

Additional Columns

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Greenplum. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au composant tGreenplumOutput consultez :

484

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la section intitule Scnario : Afficher la base de donnes en sortie du tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

485

tGreenplumOutputBulk

tGreenplumOutputBulk

Proprits du tGreenplumOutputBulk
Les composants tGreenplumOutputBulk et tGreenplumBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tGreenplumOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Greenplum Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards Greenplum. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes Greenplum. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide Utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement : Guide Utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Include header Encoding Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

486

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec le composant tGreenplumBulkExec. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes Greenplum.

Scnarios associs
Pour un scnario associ au tGreenplumOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

487

tGreenplumOutputBulkExec

tGreenplumOutputBulkExec

Proprits du tGreenplumOutputBulkExec
Les composants tGreenplumOutputBulk et tGreenplumBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tGreenplumOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/Greenplum Le tGreenplumOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tGreenplumOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Greenplum. Property Type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. File Name Nom du fichier traiter. Voir galement le Guide Utilisateur de Talend Open Studio. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant

Action on table

488

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Advanced settings Action on data Slectionnez lopration que vous voulez effectuer : Bulk insert Bulk update Les informations demandes seront diffrentes en fonction de laction choisie. Copy the OID for each Rcupre les identifiants dobjet pour chaque ligne. row Contains a header line Spcifiez que la table contient des lignes den-tte. with the names of each column in the file File type Null string Fields terminated by Escaped char Text enclosure Slectionnez le type de fichiers traiter. Chane de caractres affiche pour signifier que la valeur est nulle. Caractre, chane ou expression rgulire sparant les champs. Caractre dchappement de la ligne. Caractres utiliss pour entourer le texte.

Force not null for co- Dfinissez la nullabilit des colonnes lumns Force not null : Cochez la case correspondant la colonne (Column) que vous souhaitez dfinir comme ntant pas nulle. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

Scnarios associs
Pour un scnario associ au tGreenplumOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

489

tGreenplumRollback

tGreenplumRollback

Proprits du tGreenplumRollback
Ce composant est troitement li aux composants tGreenplumCommit et tGreenplumConnection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/Greenplum Le tGreenplumRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tGreenplumConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants Greenplum, notamment avec le tGreenplumConnection et le tGreenplumCommit. n/a

Scnario associ
Pour un scnario associ au tGreenplumRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMysqlRollback.

490

Guide de Rfrence des Composants Talend Open Studio

tGreenplumRow

tGreenplumRow

Proprits du tGreenplumRow
Famille de composant Fonction Databases/Greenplum Le tGreenplumRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tGreenplumRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tGreenplumConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

491

Proprits du tGreenplumRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table lire. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Guess Query Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Query

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de

492

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

493

tGreenplumSCD

tGreenplumSCD

Le composant tGreenplumSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tGreenplumSCD .

494

Guide de Rfrence des Composants Talend Open Studio

tHiveClose

tHiveClose

Proprits du tHiveClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Hive Le composant tHiveClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Hive. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tHiveConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li au composant tHiveConnection. Il est gnralement utilis avec un composant tHiveConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tHiveClose, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

495

tHiveConnection

tHiveConnection

Proprits du tHiveConnection
Famille de composant Fonction Objectif Basic settings Databases/Hive Le composant tHiveConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier une fois quil est valid en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes.

Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

Ce composant est gnralement utilis avec des composants Hive, notamment le composant tHiveClose. n/a

Scnarios associs
Pour un scnario associ au composant tHiveConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

496

Guide de Rfrence des Composants Talend Open Studio

tHiveRow

tHiveRow

Proprits du tHiveRow
Famille de composant Fonction Databases/Hive tHiveRow est le composant spcifique ce type de base de donnes. Il excute des requtes Hive QL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tHiveRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tHiveContion nection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

497

Scnarios associs

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide Utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Guess Query Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Query

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes Hive QL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

498

Guide de Rfrence des Composants Talend Open Studio

tHSQLDbInput

tHSQLDbInput

Proprits du tHSQLDbInput
Famille de composant Fonction Objectif Databases/HSQLDb Le composant tHSQLDbInput lit les donnes dune base de donnes et extrait les champs selon la requte excute. Le tHSQLDbInput excute une requte DB dans un ordre strictement dfini devant correspondre la dfinition du schma. Il passe ensuite la liste des champs au composant suivant laide dun lien Main row. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Running Mode Slectionnez dans la liste le type de serveur correspondant aux paramtres de votre base de donnes, parmi les quatre proposs : HSQLDb Server, HSQLDb WebServer, HSQLDb In Process Persistent, HSQLDb In Memory. Use TLS/SSL sockets Host Port Database Alias Cochez cette case pour autoriser, si besoin, le mode scuris. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. DB path Spcifiez le chemin daccs la base de donnes laquelle vous souhaitez vous connecter. Ce champ nest disponible quen mode dexcution HSQLDb In Process Persistent . Par dfaut, si la base de donnes que vous spcifiez dans ce champ nexiste pas, elle sera cre automatiquement. Si vous souhaitez changer la configuration par dfaut, modifiez le paramtre de connexion dfini dans le champ Additional

Guide de Rfrence des Composants Talend Open Studio

499

Proprits du tHSQLDbInput

JDBC parameters dans la vue Advanced settings. Db name Saisissez le nom de la base de donnes laquelle vous souhaitez vous connecter. Ce champ nest disponible quavec les modes dexcution HSQLDb In Process Persistent et HSQLDb In Memory.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Table Name Query type Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Guess Query Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Cliquez sur le bouton pour rcuprer le schma de la table. Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma.

Guess schema Query

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Lorsque le mode dexcution est HSQLDb In Process Persistent, cette proprit supplmentaire est dfinie comme ifexists=true par dfaut, ce qui signifie que la base de donnes sera automatiquement cre lorsque cest ncessaire. Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation Global Variables

Ce composant couvre toutes les possibilits de requtes SQL sur une base de donnes HSQLDb. Number of Lines : indique le nombre de lignes traites. Disponible en tant que variable After. Retourne un entier.

500

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Query : indique le nombre de requtes traites. Disponible en tant que variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Component Ok, On Component Error, On Subjob Ok, On Subjob Error. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : Run if, On Component Ok, On Component Error, On Subjob Ok, On Subjob Error. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

Scnarios associs
Pour des scnarios associs, consultez : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery .

Guide de Rfrence des Composants Talend Open Studio

501

tHSQLDbOutput

tHSQLDbOutput

Proprits du tHSQLDbOutput
Famille de composant Fonction Objectif Basic settings Databases/HSQLDb Le composant tHSQLDbOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tHSQLDbOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Running Mode Slectionnez dans la liste le type de serveur correspondant aux paramtres de votre base de donnes, parmi les quatre proposs : HSQLDb Server, HSQLDb WebServer, HSQLDb In Process Persistent, HSQLDb In Memory. Use TLS/SSL sockets Host Port Database Cochez cette case pour autoriser, si besoin, le mode scuris. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. DB path Spcifiez le chemin daccs la base de donnes laquelle vous souhaitez vous connecter. Ce champ nest disponible quen mode dexcution HSQLDb In Process Persistent . Par dfaut, si la base de donnes que vous spcifiez dans ce champ nexiste pas, elle sera cre automatiquement. Si vous souhaitez changer la configuration par dfaut, modifiez le paramtre de connexion dfini dans le champ Additional JDBC parameters dans la vue Advanced settings.

502

Guide de Rfrence des Composants Talend Open Studio

Proprits du tHSQLDbOutput

Db name

Saisissez le nom de la base de donnes laquelle vous souhaitez vous connecter. Ce champ nest disponible quavec les modes dexcution HSQLDb In Process Persistent et HSQLDb In Memory. Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table.

Table Action on table

Action on data

Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant

Guide de Rfrence des Composants Talend Open Studio

503

Proprits du tHSQLDbOutput

suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Lorsque le mode dexcution est HSQLDb In Process Persistent, cette proprit supplmentaire est dfinie comme ifexists=true par dfaut, ce qui signifie que la base de donnes sera automatiquement cre lorsque cest ncessaire. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tHSQLDbOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode tStatCatcher Statistics Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Additional Columns

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes HSQLDb. Il permet aussi de crer

504

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput. Global Variables Number of Lines : indique le nombre de lignes traites. Disponible en tant que variable After. Retourne un entier. NB line Updated : indique le nombre de lignes mises jour. Disponible en tant que variable After. Retourne un entier. NB line Inserted : indique le nombre de lignes insres. Disponible en tant que variable After. Retourne un entier. NB line Deleted : indique le nombre de lignes supprimes. Disponible en tant que variable After. Retourne un entier. NB line Rejected : indique le nombre de lignes rjetes. Disponible en tant que variable After. Retourne un entier. Query : indique le nombre de requtes traites. Disponible en tant que variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Component Ok, On Component Error, On Subjob Ok, On Subjob Error. Liens dentre (dun composant un autre) : Row : Main. Trigger : Run if, On Component Ok, On Component Error, On Subjob Ok, On Subjob Error. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

Scnarios associs
Pour un scnario associ, consultez :

Guide de Rfrence des Composants Talend Open Studio

505

Scnarios associs

la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

506

Guide de Rfrence des Composants Talend Open Studio

tHSQLDbRow

tHSQLDbRow

Proprits du tHSQLDbRow
Famille de composant Fonction Databases/HSQLDb tHSQLDbRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tHSQLDbRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Running Mode Slectionnez dans la liste le type de serveur correspondant aux paramtres de votre base de donnes, parmi les quatre proposs : HSQLDb Server, HSQLDb WebServer, HSQLDb In Process Persistent, HSQLDb In Memory. Use TLS/SSL sockets Host Port Database Alias Cochez cette case pour autoriser, si besoin, le mode scuris. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Objectif

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. DB path Spcifiez le chemin daccs la base de donnes laquelle vous souhaitez vous connecter. Ce champ nest disponible quen mode dexcution HSQLDb In Process Persistent . Par dfaut, si la base de donnes que vous spcifiez dans ce champ nexiste pas, elle sera cre automatiquement. Si vous souhaitez changer la configuration par dfaut, modifiez le paramtre de connexion dfini dans le champ Additional JDBC parameters dans la vue Advanced settings. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository.

Guide de Rfrence des Composants Talend Open Studio

507

Proprits du tHSQLDbRow

Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Query type Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Guess Query Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Query

Die on error

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Lorsque le mode dexcution est HSQLDb In Process Persistent, cette proprit supplmentaire est dfinie comme ifexists=true par dfaut, ce qui signifie que la base de donnes sera automatiquement cre lorsque cest ncessaire. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution.

508

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation Global Variables

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL. Query : indique le nombre de requtes traites. Disponible en tant que variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Row : Main,Reject, Iterate. Trigger : Run if, On Component Ok, On Component Error, On Subjob Ok, On Subjob Error. Liens dentre (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Component Ok, On Component Error, On Subjob Ok, On Subjob Error. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

Scnarios associs
Pour des scnarios associs, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes . la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL .

Guide de Rfrence des Composants Talend Open Studio

509

tInformixBulkExec

tInformixBulkExec

Proprits du tInformixBulkExec
Les composants tInformixOutputBulk et tInformixBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tInformixOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Informix Le composant tInformixBulkExec excute des oprations dInsert sur les donnes fournies. Le tInformixBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Informix. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Execution Platform Slectionnez le type de systme dexploitation que vous utilisez.

Use an existing connec- Cochez cette case et slectionnez le composant tInformixtion Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio.

510

Guide de Rfrence des Composants Talend Open Studio

Proprits du tInformixBulkExec

Host Port Database Schema

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification sur lutilisateur de base de donnes. Instance Table Action on table Nom de linstance Informix utiliser. Cette information se trouve gnralement dans le fichier SQL hosts. Nom de la table crire. Notez quune seule table peut tre crite la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear table : supprimer le contenu de la table. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Informix Directory Data file Spcifiez le chemin daccs votre rpertoire Informix. Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas.

Guide de Rfrence des Composants Talend Open Studio

511

Scnario associ

Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une cl de recherche sur laquelle baser les oprations Update et Delete. Il est possible de dfinir les colonnes qui agiront comme cl de recherche partir du schma, pour une utilisation de base, ou partir des options avances ( Advanced settings ) pour une utilisation optimise de ces oprations. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Field terminated by Set DBMONEY Set DBDATE Rows Before Commit Caractre, chane ou expression rgulire sparant les champs. Quand vous cochez cette case, vous pouvez dfinir votre sparateur dcimal dans le champ Decimal separator. Slectionnez le format de date que vous souhaitez appliquer. Saisissez le nombre de lignes traiter avant commit.

Bad Rows Before Abort Saisissez le nombre de lignes derreur avant arrt du Job. tStat Catcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Output Utilisation Slectionnez lemplacement de la sortie. Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes DB2.

Scnario associ
Pour un scnario associ au composant tInformixBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

512

Guide de Rfrence des Composants Talend Open Studio

tInformixClose

tInformixClose

Proprits du tInformixClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Informix Le composant tInformixClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Informix. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tInformixConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tInformixConnection et tInformixRollback. Ils sont gnralement utiliss avec un composant tInformixConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tInformixClose, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

513

tInformixCommit

tInformixCommit

Proprits du tInformixCommit
Ce composant est troitement li aux composants tInformixConnection et tInformixRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Informix Le composant tInformixCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tInformixConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tInformixCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Informix et notamment tInformixConnection et tInformixRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tInformixConnection et tInformixRollback. Ils sont gnralement utiliss avec un composant tInformixConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tInformixCommit, consultez la section intitule tMysqlConnection

514

Guide de Rfrence des Composants Talend Open Studio

tInformixConnection

tInformixConnection

Proprits du tInformixConnection
Ce composant est troitement li aux composants tInformixCommit et tInformixRollback. Ils sont gnralement utiliss avec un composant tInformixConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Informix Le composant tInformixConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier une fois quil est valid en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Instance Nom de linstance Informix utiliser. Cette information se trouve gnralement dans le fichier SQL hosts.

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Use Transaction Dcochez cette case lorsque la base de donnes est configure en mode NO_LOG. Si la case est coche, vous pouvez choisir dactiver ou non loption Auto Commit. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant est gnralement utilis avec des composants Informix, notamment les composants tInformixCommit et tInformixRollback.

Guide de Rfrence des Composants Talend Open Studio

515

Scnarios associs

Limitation

n/a

Scnarios associs
Pour un scnario associ au composant tInformixConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

516

Guide de Rfrence des Composants Talend Open Studio

tInformixInput

tInformixInput

Proprits du tInformixInput
Famille de composant Fonction Objectif Databases/Informix Le composant tInformixInput lit une base de donnes et en extrait des champs laide de requtes. Le tInformixInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant adquat tion partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Host name Port Database Schema Adresse IP du serveur de base de donnes. Numro de port dcoute du serveur. Nom de la base de donnes. Nom du schma.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Instance Nom de linstance Informix utiliser. Cette information se trouve gnralement dans le fichier SQL hosts.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

517

Scnarios associs

Query type et Query

Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Cliquez sur le bouton pour rcuprer le schma de la table.

Guess Query

Guess schema Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings.. Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Informix.

Scnarios associs
Consultez les scnarios associs aux composants tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

518

Guide de Rfrence des Composants Talend Open Studio

tInformixOutput

tInformixOutput

Proprits du tInformixOutput
Famille de composant Fonction Objectif Basic settings Databases/Informix Le composant tInformixOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tInformixOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant adquat tion partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro de port dcoute du serveur. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Instance Table Action on table Nom de linstance Informix utiliser. Cette information se trouve gnralement dans le fichier SQL hosts. Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire.

Guide de Rfrence des Composants Talend Open Studio

519

Proprits du tInformixOutput

Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete. Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

520

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tInformixOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Use Batch Size Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes. Nombre de lignes dans chaque lot de traitement de donnes.

Additional Columns

Optimize the batch in- Cocher cette case optimise linsertion de donnes par lots. sertion tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Informix. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au composant tInformixOutput, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

521

Scnarios associs

522

Guide de Rfrence des Composants Talend Open Studio

tInformixOutputBulk

tInformixOutputBulk

Proprits du tInformixOutputBulk
Les composants tInformixOutputBulk et tInformixBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tInformixOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Informix Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards Informix. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes Informix. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Set DBMONEY Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Quand vous cochez cette case, vous pouvez dfinir votre sparateur dcimal dans le champ Decimal separator. Slectionnez le format de date que vous souhaitez appliquer.

Set DBDATE

Guide de Rfrence des Composants Talend Open Studio

523

Scnarios associs

Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Custom the flush buffer Cochez cette case pour personnaliser la taille de la msize moire utilise pour stocker temporairement les donnes, et dans le champ Row number, saisissez le nombre de lignes aprs lesquelles la mmoire est nouveau libre. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant est gnralement utilis avec le composant tInformixBulkExec. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes Informix.

Scnarios associs
Pour un scnario associ au tInformixOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

524

Guide de Rfrence des Composants Talend Open Studio

tInformixOutputBulkExec

tInformixOutputBulkExec

Proprits du tInformixOutputBulkExec
Les composants tInformixOutputBulk et tInformixBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tInformixOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/Informix Le tInformixOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tInformixOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Informix. Property Type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Execution platform Slectionnez le type de systme dexploitation que vous utilisez.

Use an existing connec- Cochez cette case et slectionnez le composant tInformixtion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio.

Guide de Rfrence des Composants Talend Open Studio

525

Proprits du tInformixOutputBulkExec

Host Port Database Schema

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Instance Table Nom de linstance Informix utiliser. Cette information se trouve gnralement dans le fichier SQL hosts. Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear table : supprimer le contenu de la table. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Informix Directory Data file Spcifiez le chemin daccs votre rpertoire Informix. Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Action on data Cochez cette option pour ajouter des nouvelles lignes la fin du fichier. Slectionnez lopration que vous voulez effectuer : Bulk insert Bulk update Les informations demandes seront diffrentes en fonction de laction choisie. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies.

Action on table

526

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Row separator Fields terminated by Set DBMONEY Set DBDATE Rows Before Commit

Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Quand vous cochez cette case, vous pouvez dfinir votre sparateur dcimal dans le champ Decimal separator. Slectionnez le format de date que vous souhaitez appliquer. Saisissez le nombre de lignes traiter avant commit.

Bad Rows Before Abort Saisissez le nombre de lignes derreur avant arrt du Job. Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Custom the flush buffer Cochez cette case pour personnaliser la taille de la msize moire utilise pour stocker temporairement les donnes, et dans le champ Row number, saisissez le nombre de lignes aprs lesquelles la mmoire est nouveau libre. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant. Slectionnez lemplacement de la sortie.

tStatCatcher Statistics Output Utilisation Limitation

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

Scnarios associs
Pour un scnario associ au tInformixOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

527

tInformixRollback

tInformixRollback

Proprits du tInformixRollback
Ce composant est troitement li aux composants tInformixCommit et tInformixConnection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/Informix Le tInformixRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tInformixConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants Informix, notamment avec le tInformixConnection et le tInformixCommit. n/a

Scnario associ
Pour un scnario associ au tInformixRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMysqlRollback.

528

Guide de Rfrence des Composants Talend Open Studio

tInformixRow

tInformixRow

Proprits du tInformixRow
Famille de composant Fonction Databases/Informix tInformixRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tInformixRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tInformixtion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

529

Proprits du tInformixRow

Schema

Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Instance Nom de linstance Informix utiliser. Cette information se trouve gnralement dans le fichier SQL hosts.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Dcochez cette case lorsque la base de donnes est configure en mode NO_LOG.

Guess Query

Die on error

Use Transaction Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL.

530

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

531

tInformixSCD

tInformixSCD

Le composant tInformixSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tInformixSCD .

532

Guide de Rfrence des Composants Talend Open Studio

tInformixSP

tInformixSP

Proprits du tInformixSP
Famille de composant Fonction Objectif Basic settings Databases/Informix Le composant tInformixSP appelle une procdure stocke de base de donnes. Le tInformixSP permet de centraliser des requtes multiples ou complexes dans une base de donnes et de les appeler plus facilement. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tInformixtion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro de port dcoute du serveur. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

533

Proprits du tInformixSP

Instance

Nom de linstance Informix utiliser. Cette information se trouve gnralement dans le fichier SQL hosts.

Schema et Edit Schema Dans une procdure stocke, le schma est un paramtre dentre. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il est rutilisable. Voir galement le Guide utilisateur de Talend Open Studio. SP Name Saisissez le nom exact de la Procdure Stocke (SP). Is Function / Return re- Cochez cette case si une seule valeur doit tre retourne. sult in Slectionnez dans la liste la colonne du schma sur laquelle est base la valeur obtenir. Parameters Cliquez sur le bouton [+] et slectionnez dans le champ Schema Columns les diffrentes colonnes ncessaires la procdure. Notez que le schma de la SP peut contenir plus de colonnes quil ny a de paramtres utiliss dans la procdure. Slectionnez le Type de paramtre : IN : paramtre dentre (Input) OUT : paramtre de sortie (Output)/valeur retourne IN OUT : les paramtres dentre doivent tre retournes sous forme de valeur, mme aprs modifications via la procdure (fonction). RECORDSET : les paramtres dentre doivent tre retournes sous forme densemble de valeurs, au lieu dune valeur unique. Consultez la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL. Use Transaction Advanced settings Dcochez cette case lorsque la base de donnes est configure en mode NO_LOG.

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut. Dans ce cas, seuls les paramtres dentre sont autoriss.

534

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Limitation

La syntaxe de la Procdure Stocke doit correspondre celle de la base de donnes.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Excuter une procdure stocke dans le hub MDM du composant tMysqlSP. la section intitule Scnario : Vrifier le format de numros laide dune procdure stocke du composant tOracleSP. Consultez galement la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL.

Guide de Rfrence des Composants Talend Open Studio

535

tIngresClose

tIngresClose

Proprits du tIngresClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Ingres Le composant tIngresClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Ingres. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tIngresConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tIngresConnection et tIngresRollback. Ils sont gnralement utiliss avec un composant tIngresConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tIngresClose, consultezla section intitule tMysqlConnection

536

Guide de Rfrence des Composants Talend Open Studio

tIngresCommit

tIngresCommit

Proprits du tIngresCommit
Ce composant est troitement li aux composants tIngresConnection et tIngresRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Ingres Le composant tIngresCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Slectionnez le composant tIngresConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tIngresCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Close Connection

Ce composant est gnralement utilis avec des composants JDBC et notamment avec les composants tIngresConnection et tIngresRollback. n/a

Scnario associ
Pour un scnario associ au tIngresCommit, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

Guide de Rfrence des Composants Talend Open Studio

537

tIngresConnection

tIngresConnection

Proprits du tIngresConnection
Ce composant est troitement li aux composants tIngresCommit et tIngresRollback. Ils sont gnralement utiliss avec un composant tIngresConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Ingres Le composant tIngresConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Server Port Database Table Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Utilisation Limitation Ce composant est gnralement utilis avec des composants JDBC et notamment avec les composants tIngresCommit et tIngresRollback. n/a

Scnario associ
Pour un scnario associ au tIngresConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

538

Guide de Rfrence des Composants Talend Open Studio

tIngresInput

tIngresInput

Proprits du tIngresInput
Famille de composant Fonction Objectif Databases/Ingres Le composant tIngresInput lit une base de donnes et en extrait des champs laide de requtes. Le tIngresInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Server Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres.

Guide de Rfrence des Composants Talend Open Studio

539

Scnarios associs

Trim column tStatCatcher Statistics Utilisation

Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Ingres.

Scnarios associs
Consultez les scnarios associs au composant tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

540

Guide de Rfrence des Composants Talend Open Studio

tIngresOutput

tIngresOutput

Proprits du tIngresOutput
Famille de composant Fonction Objectif Basic settings Databases/Ingres Le composant tIngresOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tIngresOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro de port dcoute du serveur. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne :

Guide de Rfrence des Composants Talend Open Studio

541

Proprits du tIngresOutput

Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete. Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions

Advanced settings

Commit every

Additional Columns

542

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tIngresOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Ingres. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

543

tIngresRollback

tIngresRollback

Proprits du tIngresRollback
Ce composant est troitement li aux composants tIngresCommit et tIngresConnection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/Ingres Le tIngresRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tIngresConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants Ingres, notamment avec le tIngresConnection et le tIngresCommit. n/a

Scnario associ
Pour un scnario associ au tIngresRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMysqlRollback.

544

Guide de Rfrence des Composants Talend Open Studio

tIngresRow

tIngresRow

Proprits du tIngresRow
Famille de composant Fonction Databases/Ingres tIngresRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tIngresRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Objectif

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement

Die on error

Guide de Rfrence des Composants Talend Open Studio

545

Scnarios associs

avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Advanced settings Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

546

Guide de Rfrence des Composants Talend Open Studio

tIngresSCD

tIngresSCD

Le composant tIngresSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tIngresSCD .

Guide de Rfrence des Composants Talend Open Studio

547

tInterbaseClose

tInterbaseClose

Proprits du tInterbaseClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Interbase Le composant tInterbaseClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Interbase. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tInterbaseConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tInterbaseConnection et tInterbaseRollback. Ils sont gnralement utiliss avec un composant tInterbaseConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tInterbaseClose, consultez la section intitule tMysqlConnection

548

Guide de Rfrence des Composants Talend Open Studio

tInterbaseCommit

tInterbaseCommit

Proprits du tInterbaseCommit
Ce composant est troitement li aux composants tInterbaseConnection et tInterbaseRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Interbase Le composant tInterbaseCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Slectionnez le composant tInterbaseConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tInterbaseCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Close Connection

Ce composant est gnralement utilis avec des composants Interbase et notamment avec les composants tInterbaseConnection et tInterbaseRollback. n/a

Scnario associ
Pour un scnario associ au tInterbaseCommit, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

Guide de Rfrence des Composants Talend Open Studio

549

tInterbaseConnection

tInterbaseConnection

Proprits du tInterbaseConnection
Ce composant est troitement li aux composants tInterbaseCommit et tInterbaseRollback. Ils sont gnralement utiliss avec un composant tInterbaseConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Interbase Le composant tInterbaseConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier une fois quil est valid en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Table Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Utilisation Limitation Ce composant est gnralement utilis avec des composants Interbase, notamment les composants tInterbaseCommit et tInterbaseRollback. n/a

Scnarios associs
Pour un scnario associ au composant tInterbaseConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

550

Guide de Rfrence des Composants Talend Open Studio

tInterbaseInput

tInterbaseInput

Proprits du tInterbaseInput
Famille de composant Fonction Objectif Databases/Interbase Le composant tInterbaseInput lit une base de donnes et en extrait des champs laide de requtes. Le tInterbaseInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Host Database Adresse IP du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes.

Guide de Rfrence des Composants Talend Open Studio

551

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Interbase.

Scnarios associs
Consultez les scnarios associs au composant tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

552

Guide de Rfrence des Composants Talend Open Studio

tInterbaseOutput

tInterbaseOutput

Proprits du tInterbaseOutput
Famille de composant Fonction Objectif Basic settings Databases/Interbase Le composant tInterbaseOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tInterbaseOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Host Database Adresse IP du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne :

Guide de Rfrence des Composants Talend Open Studio

553

Proprits du tInterbaseOutput

Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete. Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Clear data in table Cochez cette case pour que les donnes soient supprimes de la table slectionne avant toute action.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions

Advanced settings

Commit every

Additional Columns

554

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tInterbaseOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Interbase. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie associ au composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes associ au composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

555

tInterbaseRollback

tInterbaseRollback

Proprits du tInterbaseRollback
Ce composant est troitement li aux composants tInterbaseCommit et tInterbaseConnection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/Interbase Le tInterbaseRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tInterbaseConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants Interbase, notamment avec le tInterbaseConnection et le tInterbaseCommit. n/a

Scnario associ
Pour un scnario associ au tInterbaseRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMySQLRollback.

556

Guide de Rfrence des Composants Talend Open Studio

tInterbaseRow

tInterbaseRow

Proprits du tInterbaseRow
Famille de composant Fonction Databases/Interbase tInterbaseRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tInterbaseRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tInterbation seConnection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Database Adresse IP du serveur de base de donnes. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

557

Proprits du tInterbaseRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Name Nom de la table traiter. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Query type Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution.

558

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes associ au composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL associ au composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

559

tJavaDBInput

tJavaDBInput

Proprits du tJavaDBInput
Famille de composant Fonction Objectif Databases/JavaDB Le composant tJavaDBInput lit une base de donnes et en extrait des champs laide de requtes. Le tJavaDBInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Framework Database DB root path Slectionnez dans la liste un framework pour votre base de donnes Java. Nom de la base de donnes. Parcourez vos fichiers jusqu la racine de votre base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

560

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes JavaDB.

Scnarios associs
Pour un scnario associ, consultez les scnarios du composant tDBInputdans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

Guide de Rfrence des Composants Talend Open Studio

561

tJavaDBOutput

tJavaDBOutput

Proprits du tJavaDBOutput
Famille de composant Fonction Objectif Basic settings Databases/JavaDB Le composant tJavaDBOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tJavaDBOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Framework Database DB root path Slectionnez dans la liste un framework pour votre base de donnes Java. Nom de la base de donnes. Parcourez vos fichiers jusqu la racine de votre base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table.

562

Guide de Rfrence des Composants Talend Open Studio

Proprits du tJavaDBOutput

Action on data

Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement sup-

Advanced settings

Commit every

Additional Columns

Guide de Rfrence des Composants Talend Open Studio

563

Scnarios associs

prime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tJavaDBOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes JavaDB. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

564

Guide de Rfrence des Composants Talend Open Studio

tJavaDBRow

tJavaDBRow

Proprits du tJavaDBRow
Famille de composant Fonction Databases/JavaDB tJavaDBRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tJavaDBRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Framework Type Database DB root path Slectionnez dans la liste un framework pour votre base de donnes Java. Nom de la base de donnes. Parcourez vos fichiers jusqu la racine de votre base de donnes.

Objectif

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma.

Guide de Rfrence des Composants Talend Open Studio

565

Scnarios associs

Die on error

Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

566

Guide de Rfrence des Composants Talend Open Studio

tJDBCColumnList

tJDBCColumnList

Proprits du tJDBCColumnList
Famille de composants Fonction Objectif Basic settings Databases/JDBC Le composant tJDBCColumList effectue une opration ditration dans toutes les colonnes dune table donne, grce une connexion JDBC dfinie. Le tJDBCColumList permet de faire une liste des libells des colonnes dune table JDBC donne. Component list Slectionnez le composant tJDBCConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Nom de la table lire.

Table name Utilisation Limitation

Il faut utiliser ce composant en association avec les autres composants JDBC, notamment avec le tJDBCConnection. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table .

Guide de Rfrence des Composants Talend Open Studio

567

tJDBCClose

tJDBCClose

Proprits du tJDBCClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/JDBC Le composant tJDBCClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes JDBC. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tJDBCConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tJDBCConnection et tJDBCRollback. Il est gnralement utilis avec un composant tJDBCConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tJDBCClose, consultez la section intitule tMysqlConnection

568

Guide de Rfrence des Composants Talend Open Studio

tJDBCCommit

tJDBCCommit

Proprits du tJDBCCommit
Ce composant est troitement li aux composants tJDBCConnection et tJDBCRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/JDBC Le composant tJDBCCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Slectionnez le composant tJDBCConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tJDBCCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Close connection

Ce composant est gnralement utilis avec des composants JDBC et notamment avec les composants tJDBCConnection et tJDBCRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tJDBCConnection et tJDBCRollback. Ils sont gnralement utiliss avec un composant tJDBCConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tJDBCCommit, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

569

tJDBCConnection

tJDBCConnection

Proprits du tJDBCConnection
Ce composant est troitement li aux composants tJDBCCommit et tJDBCRollback. Ils sont gnralement utiliss avec un composant tJDBCConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings JDBC URL Saisissez lURL JDBC dans le champ associ pour vous connecter la base de donnes. Par exemple, entrez jdbc:mysql://IP address/database name pour vous connecter une base de donnes mysql. Cliquez sur le bouton [+] sous le tableau afin dajouter autant de lignes que ncessaire pour charger diffrents JARs. Dans chaque ligne, cliquez ensuite sur le bouton [...] pour ouvrir lassistant Select Module, dans lequel vous pouvez slectionner le pilote JAR de votre choix pour chaque ligne. Renseignez la classe du driver dans le champ Driver Class en fonction de votre connexion. Par exemple, entrez com.mysql.jdbc.Driver dans ce champ pour vous connecter une base de donnes mysql. de Databases/JDBC Le composant tJDBCConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie.

Driver JAR

Driver Class

Username et Password Saisissez les informations dauthentification lutilisateur de base de donnes.

Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Use Auto commit Cochez cette case afin dafficher la case Auto Commit. Si vous la cochez, elle activera le mode auto-commit. Une fois la case Use Auto-Commit dcoche, la case Auto-Commit ne sera plus visible. Cochez cette case pour collecter les donnes de log, au niveau de chaque composant.

tStatCatcher Statistics Utilisation

Ce composant est gnralement utilis avec des composants JDBC et notamment avec les composants tJDBCCommit et tJDBCRollback.

570

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Limitation

n/a

Scnario associ
Ce composant est troitement li aux composants tJDBCCommit et tJDBCRollback. Ils sont gnralement utiliss avec un composant tJDBCConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tJDBCConnection, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

571

tJDBCInput

tJDBCInput

Proprits du tJDBCInput
Famille de composant Fonction Objectif Databases/JDBC Le composant tJDBCInput lit toute base de donnes via une API JDBC et en extrait des champs laide de requtes. Le tJDBCInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tJDBCtion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant.

Basic settings

572

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. JDBC URL Driver JAR Entrez le chemin daccs la base de donnes. Cliquez sur le bouton [+] sous le tableau afin dajouter autant de lignes que ncessaire pour charger diffrents JARs. Dans chaque ligne, cliquez ensuite sur le bouton [...] pour ouvrir lassistant Select Module, dans lequel vous pouvez slectionner le pilote JAR de votre choix pour chaque ligne. Dans le champ Class name, renseignez le nom de la classe pour quelle soit indique dans le driver.

Class Name

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type et Query Nom de la table lire. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cochez cette case et dfinissez le nombre de lignes avec lesquelles vous souhaitez travailler en une fois. Cette option permet doptimiser les performances.

Advanced settings

Use cursor

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Utilisation Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes utilisant une connection JDBC.

Scnarios associs
Pour un scnario associ, consultez les scnarios du composant tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery .

Guide de Rfrence des Composants Talend Open Studio

573

Scnarios associs

Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

574

Guide de Rfrence des Composants Talend Open Studio

tJDBCOutput

tJDBCOutput

Proprits du tJDBCOutput
Famille de composant Fonction Objectif Basic settings Databases/JDBC Le composant tJDBCOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tJDBCOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut-tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tJDBCtion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant.

Guide de Rfrence des Composants Talend Open Studio

575

Proprits du tJDBCOutput

Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. JDBC URL Driver JAR Entrez le chemin daccs la base de donnes. Cliquez sur le bouton [+] sous le tableau afin dajouter autant de lignes que ncessaire pour charger diffrents JARs. Dans chaque ligne, cliquez ensuite sur le bouton [...] pour ouvrir lassistant Select Module, dans lequel vous pouvez slectionner le pilote JAR de votre choix pour chaque ligne. Dans le champ Class name, renseignez le nom de la classe pour quelle soit indique dans le driver.

Class Name

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on data Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository.

576

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tJDBCOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Use Batch Size tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes. Nombre de lignes dans chaque lot de traitement de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Commit every

Additional Columns

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes JDBC. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au tJDBCOutput, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput.

Guide de Rfrence des Composants Talend Open Studio

577

Scnarios associs

la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

578

Guide de Rfrence des Composants Talend Open Studio

tJDBCRollback

tJDBCRollback

Proprits du tJDBCRollback
Ce composant est troitement li aux composants tJDBCCommit et tJDBCConnection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/JDBC Le tJDBCRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tJDBCConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants JDBC, notamment avec le tJDBCConnection et le tJDBCCommit. n/a

Scnario associ
Ce composant est troitement li aux composants tJDBCConnection et tJDBCCommit. Ils sont gnralement utiliss avec un composant tJDBCConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tJDBCRollback, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

579

tJDBCRow

tJDBCRow

Proprits du tJDBCRow
Famille de composant Fonction Databases/JDBC tJDBCRow est le composant gnrique pour tout type de base de donnes utilisant une API JDBC. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tJDBCRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Use an existing connec- Cochez cette case et slectionnez le composant tJDBCtion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. JDBC URL Driver JAR Entrez le chemin daccs la base de donnes. Cliquez sur le bouton [+] sous le tableau afin dajouter autant de lignes que ncessaire pour charger diffrents JARs. Dans chaque ligne, cliquez ensuite sur le bouton [...] pour ouvrir lassistant Select Module, dans lequel vous pouvez slectionner le pilote JAR de votre choix pour chaque ligne. Renseignez le nom de la classe pour quelle soit indique dans le driver.

Objectif

Basic settings

Class Name

580

Guide de Rfrence des Composants Talend Open Studio

Proprits du tJDBCRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Query type Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics

Guide de Rfrence des Composants Talend Open Studio

581

Scnarios associs

Utilisation

Ce composant offre la flexibilit des requtes sur toute base de donnes utilisant une connexion JDBC et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

582

Guide de Rfrence des Composants Talend Open Studio

tJDBCSP

tJDBCSP

Proprits du tJDBCSP
Famille de composant Fonction Objectif Basic settings Databases/JDBC Le composant tJDBCSP appelle une procdure stocke de base de donnes. Le tJDBCSP permet de centraliser des requtes multiples ou complexes dans une base de donnes et de les appeler plus facilement. JDBC URL Driver JAR Entrez le chemin daccs la base de donnes. Cliquez sur le bouton [+] sous le tableau afin dajouter autant de lignes que ncessaire pour charger diffrents JARs. Dans chaque ligne, cliquez ensuite sur le bouton [...] pour ouvrir lassistant Select Module, dans lequel vous pouvez slectionner le pilote JAR de votre choix pour chaque ligne. Dans le champ Class name, renseignez le nom de la classe pour quelle soit indique dans le driver.

Class Name

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Dans une procdure stocke, le schma est un paramtre dentre. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il est rutilisable. Voir galement le Guide utilisateur de Talend Open Studio. SP Name Saisissez le nom exact de la Procdure Stocke (SP). Is Function / Return re- Cochez cette case si une seule valeur doit tre retourne. sult in Slectionnez dans la liste la colonne du schma sur laquelle est base la valeur obtenir. Parameters Cliquez sur le bouton [+] et slectionnez dans le champ Schema Columns les diffrentes colonnes ncessaires la procdure. Notez que le schma de la SP peut contenir plus de colonnes quil ny a de paramtres utiliss dans la procdure. Slectionnez le Type de paramtre : IN : paramtre dentre (Input) OUT : paramtre de sortie (Output)/valeur retourne

Guide de Rfrence des Composants Talend Open Studio

583

Scnarios associs

IN OUT : les paramtres dentre doivent tre retournes sous forme de valeur, mme aprs modifications via la procdure (fonction). RECORDSET : les paramtres dentre doivent tre retournes sous forme densemble de valeurs, au lieu dune valeur unique. Consultez le composant la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut. Dans ce cas, seuls les paramtres dentre sont autoriss. La syntaxe de la Procdure Stocke doit correspondre celle de la base de donnes.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Excuter une procdure stocke dans le hub MDM du composant tMysqlSP. la section intitule Scnario : Vrifier le format de numros laide dune procdure stocke du composant tOracleSP. Consultez galement la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL.

584

Guide de Rfrence des Composants Talend Open Studio

tJDBCTableList

tJDBCTableList

Proprits du tJDBCTableList
Famille de composant Fonction Objectif Basic settings Databases/JDBC Le composant tJDBCTableList effectue une opration ditration sur toutes les tables dune base de donnes, grce une connexion JDBC dfinie. Le composant tJDBCTableList permet de lister les noms des tables JDBC grce aux commandes SELECT et WHERE. Component list Slectionnez le composant de connexion tJDBCConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours.

Where clause for table Saisissez la commande WHERE permettant didentifier name selection les tables sur lesquelles effectuer lopration ditration. Utilisation Limitation Il faut utiliser ce composant en association avec les autres composants JDBC, notamment avec le tJDBCConnection. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table .

Guide de Rfrence des Composants Talend Open Studio

585

tLDAPAttributesInput

tLDAPAttributesInput

Proprits du tLDAPAttributesInput
Famille de composant Fonction Objectif Databases/LDAP Le composant tLDAPAttributesInput analyse chaque lment trouv via une requte LDAP et liste une srie dattributs associs lobjet. Le tLDAPAttributesInput excute une LDAP base sur un filtre prdfini et correspondant au schma dfini. Puis la liste de champ est transmise au composant suivant via une connexion Main row. Property type Peut-tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et cliquez sur le composant tLDAPContion nection dans la liste Component List, afin de rutiliser les informations de la connexion que vous avez prcdemment dfinie. Host Port Base DN Protocol Adresse IP du serveur dannuaire LDAP. Numro du port dcoute du serveur. Chemin daccs larborescence de lutilisateur autoris. Slectionnez le type de protocole dans la liste. LDAP : aucun codage nest utilis LDAPS : LDAP scuris. Quand cette option est slectionne, la case Advanced CA apparat. Une fois slectionn, le mode avanc vous permet de spcifier le rpertoire et le mot de passe de la cl secrte du certificat pour le stockage dun CA spcifique. Cependant, vous pouvez toujours dsactiver la validation du certificat, en cochant la case Trust all certs. TLS : le certificat est utilis. Quand cette option est slectionne, la case Advanced CA apparat et est utilise de la mme faon que pour le type LPDAPS. Authentication User et Cochez Authentication si une connexion LDAP est nPassword cessaire. Notez que le login doit correspondre la syntaxe LDAP pour tre valide. Par exemple : cn=Directory Manager. Filter Saisissez le filtre comme attendu par lannuaire LDAP db. Multi valued field sepa- Saisissez le sparateur de valeur des champs valeurs mulrator tiples. Alias dereferencing Slectionnez loption dans la liste. Never permet lamlioration des performances de recherche si vous tes

Basic settings

586

Guide de Rfrence des Composants Talend Open Studio

Proprits du tLDAPAttributesInput

sr quaucun alias nest drfrenc. Par dfaut, utilisez Always : Always : les alias sont toujours drfrencs. Never : les alias ne sont jamais drfrencs. Searching : cette option drfrence les alias uniquement aprs la rsolution du nom. Finding : cette option drfrence les alias uniquement lors de la rsolution du nom. Referral handling Slectionnez loption dans la liste : Ignore : ne tient pas compte des redirections des requtes Follow : tient compte des redirections des requtes Limit Time Limit Paging Die on error Cette option permet de limiter le nombre denregistrement lus, si ncessaire. Cette option permet de limiter la dure de connexion lannuaire. Spcifiez le nombre dentres retournes en une fois par le serveur LDAP. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Comme ce composant sert lister les attributs associs un lment LDAP, sont schma est prdfini. Conservez ces colonnes dfinies, mme si vous avez besoin dajouter de nouvelles colonnes. Pour cela, utilisez le mode Built-In. Le schma prdfini comprend : - objectclass : liste des classes dlments - mandatoryattributes : liste des attributs obligatoires pour ces classes - optionalattributes : liste des attributs facultatifs pour ces classes - objectattributes : liste des attributs essentiels aux lments analyss.

Guide de Rfrence des Composants Talend Open Studio

587

Scnario associ

Advanced settings

Class Definition Root tStatCatcher Statistics

Spcifiez la racine de lespace de nom de llment Class definition. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les requtes LDAP possibles. Note : Appuyez sur Ctrl + Espace pour accder la liste des variables globales, inclus la variable GetResultName permettant de rcuprer automatiquement la base correspondante.

Scnario associ
Le composant tLDAPAttributesInput fonctionne de manire similaire au tLDAPInput. Vous pouvez donc consulter la section intitule Scnario : Afficher le contenu filtr dun annuaire LDAP

588

Guide de Rfrence des Composants Talend Open Studio

tLDAPConnection

tLDAPConnection

Proprits du tLDAPConnection
Famille de composant Fonction Objectif Databases/LDAP Le composant tLDAPConnection ouvre une connexion au serveur dun annuaire pour effectuer des transactions de donnes. Le tLDAPConnection cre une connexion au serveur dun annuaire LDAP. Cette connexion peut tre invoque par dautres composants devant accder lannuaire LDAP, cest--dire les composants tLDAPInput, tLDAPOutput, etc. Property type Peut-tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Protocol Adresse IP du serveur dannuaire LDAP. Numro du port dcoute du serveur. Slectionnez le type de protocole dans la liste. LDAP : aucun codage nest utilis LDAPS : LDAP scuris. Quand cette option est slectionne, la case Advanced CA apparat. Une fois slectionn, le mode avanc vous permet de spcifier le rpertoire et le mot de passe de la cl secrte du certificat pour le stockage dun CA spcifique. Cependant, vous pouvez toujours dsactiver la validation du certificat, en cochant la case Trust all certs. TLS : le certificat est utilis. Quand cette option est slectionne, la case Advanced CA apparat et est utilise de la mme faon que pour le type LPDAPS. Base DN User et Password Chemin daccs larborescence de lutilisateur autoris. Renseignez les champs User et Password comme requis par lannuaire. Notez que le login doit correspondre la syntaxe LDAP pour tre valide. Par exemple : cn=Directory Manager. Slectionnez loption dans la liste. Never permet lamlioration des performances de recherche si vous tes sr quaucun alias nest drfrenc. Par dfaut, utilisez Always : Always : les alias sont toujours drfrencs. Never : les alias ne sont jamais drfrencs. Searching : cette option drfrence les alias uniquement aprs la rsolution du nom.

Basic settings

Alias dereferencing

Guide de Rfrence des Composants Talend Open Studio

589

Scnario associ

Finding : cette option drfrence les alias uniquement lors de la rsolution du nom. Referral handling Slectionnez loption dans la liste : Ignore : ne tient pas compte des redirections des requtes. Follow : tient compte des redirections des requtes. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant doit tre utilis avec dautres composants LDAP, notamment les composants tLDAPInput et tLDAPOutput.

Scnario associ
Ce composant est troitement li au tLDAPInput et au tLDAPOutput, puisquil vous permet de ne pas avoir toujours saisir les informations de connexion lors de lutilisation de diffrents tLDAPInput ou tLDAPOutput. Pour un scnario associ au tLDAPConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

590

Guide de Rfrence des Composants Talend Open Studio

tLDAPInput

tLDAPInput

Proprits du tLDAPInput
Famille de composant Fonction Objectif Databases/LDAP Le composant tLDAPInput lit un rpertoire et extrait les donnes en fonction dun filtre dfini. Le tLDAPInput excute une LDAP base sur un filtre prdfini et correspondant au schma dfini. Puis la liste de champ est transmise au composant suivant via une connexion Main row. Property type Peut-tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio . Use an existing connec- Cochez cette case et cliquez sur le composant tLDAPContion nection dans la liste Component List, afin de rutiliser les informations de la connexion que vous avez prcdemment dfinie. Host Port Base DN Adresse IP du serveur dannuaire LDAP. Numro du port dcoute du serveur. Chemin daccs larborescence de lutilisateur autoris. Pour retrouver les informations compltes du Distinguished Name, ajoutez un champ appel DN dans le schma, en minuscules ou en majuscules. Protocol Slectionnez le type de protocole dans la liste. LDAP : aucun codage nest utilis LDAPS : LDAP scuris. Quand cette option est slectionne, la case Advanced CA apparat. Une fois slectionn, le mode avanc vous permet de spcifier le rpertoire et le mot de de passe de la cl secrte du certificat pour le stockage dun CA spcifique. Cependant, vous pouvez toujours dsactiver la validation du certificat, en cochant la case Trust all certs.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

591

Proprits du tLDAPInput

TLS : le certificat est utilis. Quand cette option est slectionne, la case Advanced CA apparat et est utilise de la mme faon que pour le type LPDAPS. Authentication User et Cochez Authentication si une connexion LDAP est nPassword cessaire. Notez que le login doit correspondre la syntaxe LDAP pour tre valide. Par exemple : cn=Directory Manager. Filter Saisissez le filtre comme attendu par lannuaire LDAP db. Multi valued field sepa- Saisissez le sparateur de valeur des champs valeurs mulrator tiples. Alias dereferencing Slectionnez loption dans la liste. Never permet lamlioration des performances de recherche si vous tes sr quaucun alias nest drfrenc. Par dfaut, utilisez Always : Always : les alias sont toujours drfrencs. Never : les alias ne sont jamais drfrencs. Searching : cette option drfrence les alias uniquement aprs la rsolution du nom. Finding : cette option drfrence les alias uniquement lors de la rsolution du nom. Referral handling Slectionnez loption dans la liste : Ignore : ne tient pas compte des redirections des requtes. Follow : tient compte des redirections des requtes. Limit Time Limit Paging Die on error Cette option permet de limiter le nombre denregistrement lus, si ncessaire. Cette option permet de limiter la dure de connexion lannuaire. Spcifiez le nombre dentres retournes en une fois par le serveur LDAP. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Utilisation Ce composant couvre toutes les requtes LDAP possibles.

592

Guide de Rfrence des Composants Talend Open Studio

Scnario : Afficher le contenu filtr dun annuaire LDAP

Note : Appuyez sur Ctrl + Espace pour accder la liste des variables globales, inclus la variable GetResultName permettant de rcuprer automatiquement la base correspondante.

Scnario : Afficher le contenu filtr dun annuaire LDAP


Le Job dcrit ci-dessous filtre simplement lannuaire LDAP et affiche le rsultat dans la console Run Job.

Cliquez et dposez les composants tLDAPInput et tLogRow. Paramtrez les proprits du tLDAPInput. Slectionnez Repository dans le champ Property type si vous avez stock les informations de connexion LDAP dans le Metadata Manager du Repository. Puis slectionnez lentre adquate dans la liste. En mode Built-In, renseignez manuellement les champs Host et Port. Host peut tre ladresse IP du serveur de lannuaire LDAP ou son nom DNS. Aucune Base DN particulire ne doit tre paramtre.

Puis dans le champ Protocol, slectionnez le protocole adquat dans la liste. Dans cet exemple : un protocole LDAP simple est utilis.

Guide de Rfrence des Composants Talend Open Studio

593

Scnario : Afficher le contenu filtr dun annuaire LDAP

Cochez la case Authentication et renseignez les informations de connexion pour lire lannuaire, si ncessaire. Dans ce scnario, aucune authentification nest ncessaire. Dans la zone Filter, saisissez la commande sur laquelle est base la slection de donnes. Dans cet exemple, le filtre est : (&(objectClass=inetorgperson)&(uid=PIERRE DUPONT)). Renseignez le champ Multi-valued field separator avec une virgule, puisque certains champs contiennent plus dune valeur spare par une virgule. Comme vous ne savez pas si des alias sont utiliss dans lannuaire LDAP, slectionnez Always dans la liste. Slectionnez Ignore dans le champ Referral handling. Dans le champ Limit, dfinissez la limite 100 dans cet exemple.

Dfinissez le Schma tel quil est requis par lannuaire LDAP. Dans cet exemple, le schma est compos de six colonnes dont les colonnes objectClass et uid qui seront filtres. Dans le composant tLogRow, aucune configuration particulire nest exige.

Seule une entre de lannuaire correspond aux critres du filtre dfini dans le composant tLDAPInput.

594

Guide de Rfrence des Composants Talend Open Studio

tLDAPOutput

tLDAPOutput

Proprits du tLDAPOutput
Famille de composant Fonction Objectif Databases/LDAP Le composant tLDAPOutput crit dans un annuaire LDAP. Le tLDAPOutput excute une requte LDAP base sur un filtre prdfini et correspondant un schma dfini. Puis la liste de champ est transmise au composant suivant via une connexion Main row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et cliquez sur le composant tLDAPContion nection dans la liste Component List, afin de rutiliser les informations de la connexion que vous avez prcdemment dfinie. Host Port Base DN Protocol Adresse IP du serveur dannuaire LDAP. Numro de port dcoute du serveur. Chemin daccs larborescence de lutilisateur autoris. Slectionnez le type de protocole dans la liste. LDAP : aucun codage nest utilis LDAPS : LDAP scuris. Quand cette option est slectionne, la case Advanced CA apparat. Une fois slectionn, le mode avanc vous permet de spcifier le rpertoire et le mot de passe de la cl secrte du certificat pour le stockage dun CA spcifique. Cependant, vous pouvez toujours dsactiver la validation du certificat, en cochant la case Trust all certs. TLS : le certificat est utilis. Quand cette option est slectionne, la case Advanced CA apparat et est utilise de la mme faon que pour le type LPDAPS. User et Password Renseignez les champs User (utilisateur) et Password (mot de passe) conformment lannuaire.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

595

Proprits du tLDAPOutput

Notez que le login doit correspondre la syntaxe LDAP pour tre valide. Par exemple : cn=Directory Manager. Multi valued field sepa- Caractre, chane ou expression rgulire sparant les inrator formations dans un champ multi-valu. Alias dereferencing Slectionnez loption dans la liste. Never permet lamlioration des performances de recherche si vous tes sr quaucun alias nest drfrenc. Par dfaut, utilisez Always. Always : les alias sont toujours drfrencs. Never : les alias ne sont jamais drfrencs. Searching : cette option drfrence les alias uniquement aprs la rsolution du nom. Finding : cette option drfrence les alias uniquement lors de la rsolution du nom. Referral handling Slectionnez loption dans la liste : Ignore : ne tient pas compte des redirections des requtes. Follow : tient compte des redirections des requtes. Insert mode Slectionnez laction dans la liste : Add : ajoute une valeur dans un attribut multi-valu Insert : insre de nouvelles donnes Update : met jour les donnes existantes Delete : supprime les donnes slectionnes de lannuaire Insert or Update : insre et met jour les donnes DN Column Name Slectionnez, partir de la liste droulante, le type dentre LDAP utilis.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

Advanced settings

Use Attribute Options Cochez cette case afin de slectionner l'attribut souhai(for update mode) t (y compris dn, dc, ou, objectClass, mail et uid) et l'opration correspondante (notamment Add, Replace, Remove Attribute, et Remove Value)

596

Guide de Rfrence des Composants Talend Open Studio

Scnario : Editer des donnes dans un annuaire LDAP

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les requtes LDAP possibles. Note : Appuyez sur Ctrl + Espace pour accder la liste des variables globales, inclus la variable GetResultName permettant de rcuprer automatiquement la base correspondante. Ce composant permet de faire des actions sur une table ou les donnes dune table dune base de donnes Oracle. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnario : Editer des donnes dans un annuaire LDAP


Le scnario suivant dcrit un Job qui lit un annuaire LDAP, met jour le-mail dune entre slectionne et affiche la sortie avant de mettre jour lannuaire LDAP en sortie. Cest--dire quaucun alias nest drfrenc et quaucune requte nest redirige. Ce scnario est bas sur le scnario du LDAPInput (cf. la section intitule Scnario : Afficher le contenu filtr dun annuaire LDAP ). Le rsultat obtenu est une entre simple, correspondant une personne organisationnelle dont le-mail est mis jour.

Cliquez et dposez les composants tLDAPInput, tLDAPOutput, tMap et tLogRow dans lespace de modlisation. Connectez le composant dentre au tMap puis au tLogRow puis au composant de sortie. Dans la vue Component du tLDAPInput, paramtrez les informations de connexion au serveur dannuaire LDAP, ainsi que les filtres tel que dcrit dans la section intitule Scnario : Afficher le contenu filtr dun annuaire LDAP . Simplifiez le schma en enlevant les champs suivants : dc, ou, objectclass.

Puis ouvrez le mapper pour dfinir les changements excuter. Glissez et dposez la colonne uid de la table dentre (input) la table de sortie (output) puisque aucune modification nest ncessaire pour cette colonne.

Guide de Rfrence des Composants Talend Open Studio

597

Scnario : Editer des donnes dans un annuaire LDAP

Dans le champ Expression de la colonne dn de la table de sortie (output), saisissez lexpression exacte attendue par le serveur LDAP afin quil atteigne larborescence souhaite et permette dcrire dans lannuaire, condition que vous nayez pas dj renseign le champ Base DN du composant tLDAPOutput. Dans cet exemple, la variable globale GetResultName est utilise pour rcuprer automatiquement le chemin daccs. Appuyez sur Ctrl+Espace pour accder la liste de variable et slectionnez tLDAPInput_1_RESULT_NAME. Dans le champ Expression de la colonne mail, saisissez ladresse e-mail qui remplacera celle obsolte dans lannuaire LDAP. Dans cet exemple, le nouvel e-mail est : Pierre.Dupont@talend.com. Cliquez sur OK pour valider les modifications. Le composant tLogRow ne ncessite pas de paramtrage particulier. Puis slectionnez le composant tLDAPOutput pour dfinir les proprits dcriture dans lannuaire.

Dfinissez manuellement les champs Port et Host si ces informations ne sont pas stockes dans le Repository. Dans le champ Base DN, dfinissez la plus haute arborescence laquelle vous avez accs. Si vous navez pas dfini le chemin complet et exact au DN cible, dfinissez-le ici. Dans cet exemple, le DN complet est fournit par la sortie dn du composant tMap, Ainsi, seule la plus haute arborescence accessible est fournie : o=directoryRoot. Slectionnez le protocole utiliser : LDAP pour cet exemple. Puis renseignez les champs User et Password attendus par lannuaire LDAP. Dans le champ Multi-valued field separator, saisissez une virgule afin de sparer les champs contenant plusieurs valeurs spares par des virgules. Laissez les paramtres par dfaut des champs Alias Dereferencing et Referral Handling, cest--dire respectivement Always et Ignore. Dans le champ Insert mode, slectionnez loption Update pour cet exemple (ladresse email). Le schma est rcupr du composant prcdent laide dune opration de propagation.

598

Guide de Rfrence des Composants Talend Open Studio

Scnario : Editer des donnes dans un annuaire LDAP

Enregistrez le Job et excutez-le en appuyant sur la touche F6.

La sortie montre les champs suivants : dn, uid et mail comme dfini dans le Job.

Guide de Rfrence des Composants Talend Open Studio

599

tLDAPRenameEntry

tLDAPRenameEntry

Proprits du tLDAPRenameEntry
Famille de composant Fonction Objectif Basic settings Databases/LDAP Le composant tLDAPRenameEntry renomme des entres dans un annuaire LDAP. Le tLDAPRenameEntry permet de renommer une ou des entre(s) dans un annuaire LDAP slectionn. Property type Peut-tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et cliquez sur le composant tLDAPContion nection dans la liste Component List, afin de rutiliser les informations de la connexion que vous avez prcdemment dfinie. Host Port Base DN Protocol Adresse IP du serveur dannuaire LDAP. Numro du port dcoute du serveur. Chemin daccs larborescence de lutilisateur autoris. Slectionnez le type de protocole dans la liste. LDAP : aucun codage nest utilis LDAPS : LDAP scuris TLS : le certificat est utilis User et Password Renseignez les informations dauthentification de lutilisateur. Notez que le login doit correspondre la syntaxe LDAP pour tre valide. Par exemple : cn=Directory Manager. Slectionnez loption dans la liste. Never permet lamlioration des performances de recherche si vous tes sr quaucun alias nest drfrenc. Par dfaut, utilisez Always : Always : les alias sont toujours drfrencs. Never : les alias ne sont jamais drfrencs. Searching : cette option drfrence les alias uniquement aprs la rsolution du nom. Finding : cette option drfrence les alias uniquement lors de la rsolution du nom. Referrals handling Slectionnez loption dans la liste : Ignore : ne tient pas compte des redirections des requtes

Alias dereferencing

600

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Follow : tient compte des redirections des requtes Previous DN et New DN Slectionnez partir de la liste droulante la colonne du schma portant lancien DN (Previous DN) et celle portant le nouveau DN appliquer (New DN). Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

Utilisation

Ce composant couvre toutes les requtes LDAP possibles. Il est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis en association avec dautres composants. Note : Appuyez sur Ctrl + Espace pour accder la liste des variables globales, inclus la variable GetResultName permettant de rcuprer automatiquement la base correspondante.

Scnarios associs
Pour un scnario associ au composant tLDAPRenameEntry, consultez : la section intitule Scnario : Afficher le contenu filtr dun annuaire LDAP du composant tLDAPInput. la section intitule Scnario : Editer des donnes dans un annuaire LDAP du tLDAPOutput.

Guide de Rfrence des Composants Talend Open Studio

601

tMaxDBInput

tMaxDBInput

Proprits du tMaxDBInput
Famille de composant Fonction Objectif Databases/MaxDB Le composant tMaxDBInput lit une table de base de donnes et en extrait des champs laide de requtes. Le tMaxDBInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio . Host name Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type et Query Saisissez le nom de la table. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

602

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Guess Query

Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Cliquez sur le bouton pour rcuprer le schma de la table.

Guess schema Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL.

Scnarios associs
Pour un scnario associ, consultez les scnarios dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery .

Guide de Rfrence des Composants Talend Open Studio

603

tMaxDBOutput

tMaxDBOutput

Proprits du tMaxDBOutput
Famille de composant Fonction Objectif Basic settings Databases/MaxDB Le composant tMaxDBOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tMaxDBOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

604

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMaxDBOutput

Action on data

Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement sup-

Advanced settings

Commit every

Additional Columns

Guide de Rfrence des Composants Talend Open Studio

605

Scnarios associs

prime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tMaxDBOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes MaxDB. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

606

Guide de Rfrence des Composants Talend Open Studio

tMaxDBRow

tMaxDBRow

Proprits du tMaxDBRow
Famille de composant Fonction Databases/MaxDB tMaxDBRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tMaxDBRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur. Nom de la base de donnes.

Objectif

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type Saisissez le nom de la table. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement

Die on error

Guide de Rfrence des Composants Talend Open Studio

607

Scnarios associs

avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Advanced settings Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

608

Guide de Rfrence des Composants Talend Open Studio

tMSSqlBulkExec

tMSSqlBulkExec

Proprits du tMSSqlBulkExec
Les composants tMSSqlOutputBulk et tMSSqlBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tMSSqlOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/MSSql Effectue une action dInsert sur les donnes fournies. Le composant tMSSqlBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes MSSql. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMSSqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Guide de Rfrence des Composants Talend Open Studio

609

Proprits du tMSSqlBulkExec

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Remote File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Action Slectionnez lopration que vous voulez effectuer : Bulk insert Bulk update Bcp query out Les informations demandes seront diffrentes en fonction de laction choisie. Bulk insert & Bulk update Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Fields terminated Rows terminated First row Code page Caractre, chane ou expression rgulire sparant les champs. Caractre, chane ou expression rgulire sparant les lignes. Saisissez le numro du rang partir duquel vous voulez dmarrer laction. Cette valeur peut prendre plusieurs formes : OEM (valeur par dfaut)

Action on table

610

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

ACP RAW : Personnalise par lutilisateur. Data file type Output Slectionnez le type de donnes traiter. Slectionnez la sortie utiliser pour rcuprer la sortie standard de la base MSSql : to console : vers la console. to global variable : vers la variable globale. tStatCatcher Statistics Bcp query out Fields terminated Rows terminated Data file type Output Cochez cette case pour collecter les donnes de log au niveau du composant. Caractre, chane ou expression rgulire sparant les champs. Caractre, chane ou expression rgulire sparant les lignes. Slectionnez le type de donnes traiter. Slectionnez la sortie utiliser pour rcuprer la sortie standard de la base MSSql : to console : vers la console. to global variable : vers la variable globale. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec un composant tMSSqlOutputBulk. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes MSSql.

Scnarios associs
Pour un scnario associ au composant tMSSqlBulkExec, consultez les scnarios suivants : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

611

tMSSqlClose

tMSSqlClose

Proprits du tMSSqlClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/MSSql Le composant tMSSqlClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes MSSql. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tMSSqlConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tMSSqlConnection et tMSSqlRollback. Il est gnralement utilis avec un composant tMSSqlConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tMSSqlClose, consultez la section intitule tMysqlConnection

612

Guide de Rfrence des Composants Talend Open Studio

tMSSqlColumnList

tMSSqlColumnList

Proprits du tMSSqlColumnList
Famille de composant Fonction Objectif Basic settings Databases/MS SQL Le composant tMSSqlColumList effectue une opration ditration dans toutes les colonnes dune table donne, grce une connexion MS SQL dfinie. Le tMSSqlColumList permet de faire une liste des libells des colonnes dune table MS SQL donne. Component list Slectionnez le composant tMSSqlConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Entrez le nom de la table.

Table name Utilisation Limitation

Il faut utiliser ce composant en association avec les autres composants MS SQL, notamment avec le tMSSqlConnection. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table .

Guide de Rfrence des Composants Talend Open Studio

613

tMSSqlCommit

tMSSqlCommit

Proprits du tMSSqlCommit
Ce composant est troitement li aux composants tMSSqlConnection et tMSSqlRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/MSSql Le composant tMSSqlCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tMSSqlConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tMSSqlCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants MSSql et notamment avec les composants tMSSqlConnection et tMSSqlRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tMSSqlConnection et tMSSqlRollback. Ils sont gnralement utiliss avec un composant tMSSqlConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tMSSqlCommit, consultez la section intitule tMysqlConnection .

614

Guide de Rfrence des Composants Talend Open Studio

tMSSqlConnection

tMSSqlConnection

Proprits du tMSSqlConnection
Ce composant est troitement li aux composants tMSSqlCommit et tMSSqlRollback. Ils sont gnralement utiliss avec un composant tMSSqlConnection car il permet douvrir une connexion pour la transaction en cours.

Famille de composant Fonction Objectif Basic settings

Databases/MSSQL Le composant tMSSqlConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Schema Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom du schma. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants MSSql, notamment les composants tMSSqlCommit et tMSSqlRollback. n/a

Guide de Rfrence des Composants Talend Open Studio

615

Scnario associ

Scnario associ
Ce composant est troitement li aux composants tMSSqlCommit et tMSSqlRollback. Ils sont gnralement utiliss avec un composant tMSSqlConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tMSSqlConnection, consultez la section intitule tMysqlConnection .

616

Guide de Rfrence des Composants Talend Open Studio

tMSSqlInput

tMSSqlInput

Proprits du tMSSqlInput
Famille de composant Fonction Objectif Databases/MS SQL Server Le composant tMSSqlInput lit une base de donnes et en extrait des champs laide de requtes. Le tMSSqlInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMSSqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

617

Scnarios associs

Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository). Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type et Query Nom de la table lire. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes MS Sql.

Scnarios associs
Pour un scnario associ, consultez les scnarios des composants tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du tContextLoad.

618

Guide de Rfrence des Composants Talend Open Studio

tMSSqlLastInsertId

tMSSqlLastInsertId

Proprits du tMSSqlLastInsertId
Famille de composant Fonction Objectif Basic settings Databases/MS SQL server tMSSqlLastInsertId affiche les derniers ID ajouts une table partir dune connexion MSSql spcifie. tMSSqlLastInsertId permet de rcuprer les cls primaires des entres dernirement ajoutes par un utilisateur une table MSSql. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Component list Advanced settings Utilisation tStatCatcher Statistics Slectionnez le composant tMSSqlConnection dans la liste sil y a plus dune connexion dans votre Job. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL.

Scnario associ
Pour un scnario associ au composant tMSSqlLastInsertId, consultez la section intitule Scnario : Rcuprer les ID des dernires entres ajoutes .

Guide de Rfrence des Composants Talend Open Studio

619

tMSSqlOutput

tMSSqlOutput

Proprits du tMSSqlOutput
Famille de composant Fonction Objectif Basic settings Databases/MS SQL server Le composant tMSSqlOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tMSSqlOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut-tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMSSqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio.

620

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMSSqlOutput

Host Port Schema Database

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom du schma. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : Default : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if not exists : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Turn on identity insert Cochez cette case pour utiliser votre propre squence sur les valeurs Identity des donnes insres (plutt que de laisser le serveur SQL choisir les valeurs squentielles). Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Single Insert Query : Ajouter de nouvelles entres la table, regroupes dans un lot. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Insert if not exist : Ajouter de nouvelles entres la table si ncessaire. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit

Action on data

Guide de Rfrence des Composants Talend Open Studio

621

Proprits du tMSSqlOutput

Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Specify identity field Cochez cette case pour spcifier quel est le champ identity (Identity field), constitu dun numro didentification incrment automatiquement. Lorsque cette case est coche, trois autres champs saffichent : Identity field : slectionnez dans la liste la colonne que vous souhaitez dfinir comme champ identity. Start value : saisissez une valeur de dpart, utilise pour la premire ligne charge dans la table. Step : saisissez une valeur dincrment, ajoute la valeur de la ligne prcdemment charge. Vous pouvez galement spcifier le champ identity (Identity field) partir du schma du composant. Pour ce faire, paramtrez le type de base de donnes (DB Type) de la colonne correspondante en INT IDENTITY. Lorsque la case Specify identity field est coche, le type de base de donnes (DB Type) INT IDENTITY du schma est ignor. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings.

622

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMSSqlOutput

Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tMSSqlOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes.

Additional Columns

Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement dune table de base de donnes. Assurez-vous que la case Nullable est bien coche pour les colonnes du schma correspondantes. tStatCatcher Statistics Use Batch Size Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case afin dactiver le mode batch pour le traitement des donnes. Dans le champ Batch Size qui apparat, vous pouvez saisir le nombre de lignes par lot charger. Cette case est disponible uniquement si vous avez choisi loption Insert, Update, Single Insert Query ou Delete dans le champ Action on data. Si vous utilisez la version 2008 du serveur MS Sql, assurez-vous que le nombre de lignes par lot charger soit infrieur ou gal 2000 marqueurs de paramtres, divis par le nombre de colonnes du schma. Utilisation Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes MSSql. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un

Guide de Rfrence des Composants Talend Open Studio

623

Scnarios associs

exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au composant tMSSqlOutput, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

624

Guide de Rfrence des Composants Talend Open Studio

tMSSqlOutputBulk

tMSSqlOutputBulk

Proprits du tMSSqlOutputBulk
Les composants tMSSqlOutputBulk et tMSSqlBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tMSSqlOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/MSSql Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards MSSql. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes MSSQL. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Include header Encoding Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

625

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec le composant tMSSQlBulkExec. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes MSSQL.

Scnarios associs
Pour un scnario associ au tMSSqlOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

626

Guide de Rfrence des Composants Talend Open Studio

tMSSqlOutputBulkExec

tMSSqlOutputBulkExec

Proprits du tMSSqlOutputBulkExec
Les composants tMSSqlOutputBulk et tMSSqlBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tMSSqlOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/MSSql Le tMSSqlOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tMSSqlOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes MSSQL. Action Property Type Permet de choisir entre les options Bulk Insert et Bulk update. Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMSSqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Guide de Rfrence des Composants Talend Open Studio

627

Proprits du tMSSqlOutputBulkExec

Schema

Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Advanced settings Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Action on table

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Field separator Row separator First row Include header Caractre, chane ou expression rgulire sparant les champs. Chane (ex : \n sous Unix) sparant les lignes. Saisissez le numro du rang partir duquel vous voulez dmarrer laction. Cochez cette case pour inclure len-tte des colonnes dans le fichier.

628

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Data file type Encoding

Slectionnez le type de donnes traiter. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

Scnarios associs
Pour un scnario associ au tMSSqlOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

629

tMSSqlRollback

tMSSqlRollback

Proprits du tMSSqlRollback
Ce composant est troitement li aux composants tMSSqlCommit et tMSSqlConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases Le tMSSqlRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tMSSqlConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce component est gnralement utilis avec dautres composants MSSql, notamment les composants tMSSqlConnection et tMSSqlCommit. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

630

Guide de Rfrence des Composants Talend Open Studio

tMSSqlRow

tMSSqlRow

Proprits du tMSSqlRow
Famille de composant Fonction Databases/DB2 tMSSqlRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tMSSqlRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMSSqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

631

Proprits du tMSSqlRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit exister pour que lopration dInsert soit autorise. Cochez cette case pour utiliser votre propre squence sur les valeurs Identity des donnes insres (plutt que de laisser le serveur SQL choisir les valeurs squentielles). Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Turn on identity insert

Query type

Die on error

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre.

632

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

633

tMSSqlSCD

tMSSqlSCD

Le composant tMSSqlSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tMSSqlSCD .

634

Guide de Rfrence des Composants Talend Open Studio

tMSSqlSP

tMSSqlSP

Proprits du tMSSqlSP
Famille de composant Fonction Objectif Basic settings Databases/MSSql Le composant tMSSqlSP appelle une procdure stocke de base de donnes. Le tMSSqlSP permet de centraliser des requtes multiples ou complexes dans une base de donnes et de les appeler plus facilement. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier des proprits du composant. Les champs suivants sont alors pr-remplis. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMSSqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification sur lutilisateur de base de donnes. Schema et Edit Schema Dans une procdure stocke, le schma est un paramtre dentre.

Guide de Rfrence des Composants Talend Open Studio

635

Scnarios associs

Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il est rutilisable. Voir galement le Guide utilisateur de Talend Open Studio. SP Name Saisissez le nom exact de la Procdure Stocke (SP). Is Function / Return re- Cochez cette case, si une seule valeur doit tre retourne. sult in Slectionnez dans la liste la colonne du schma sur laquelle est base la valeur obtenir. Parameters Cliquez sur le bouton [+] et slectionnez dans le champ Schema Columns les diffrentes colonnes ncessaires la procdure. Notez que le schma de la SP peut contenir plus de colonnes quil ny a de paramtres utiliss dans la procdure. Slectionnez le Type de paramtre : IN : paramtre dentre (Input) OUT : paramtre de sortie (Output)/valeur retourne IN OUT : les paramtres dentre doivent tre retournes sous forme de valeur, mme aprs modifications via la procdure (fonction). RECORDSET : les paramtres dentre doivent tre retournes sous forme densemble de valeurs, au lieu dune valeur unique. Consultez la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut. Dans ce cas, seuls les paramtres dentre sont autoriss. La syntaxe de la Procdure Stocke doit correspondre celle de la base de donnes.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Excuter une procdure stocke dans le hub MDM du composant tMysqlSP.

636

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la section intitule Scnario : Vrifier le format de numros laide dune procdure stocke du tOracleSP. Consultez galement la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL.

Guide de Rfrence des Composants Talend Open Studio

637

tMSSqlTableList

tMSSqlTableList

Proprits du tMSSqlTableList
Famille de composant Fonction Objectif Basic settings Databases/MS SQL Le composant tMSSqlTableList effectue une opration ditration sur toutes les tables dune base de donnes, grce une connexion MS SQL dfinie. Le composant tMSSqlTableList permet de lister les noms des tables MS SQL grce aux commandes SELECT et WHERE. Component list Slectionnez le composant tMSSqlConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours..

Where clause for table Saisissez la commande WHERE permettant didentifier name selection les tables sur lesquelles effectuer lopration ditration. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Il faut utiliser ce composant en association avec les autres composants MS SQL, notamment avec le tMSSqlConnection. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table .

638

Guide de Rfrence des Composants Talend Open Studio

tMysqlBulkExec

tMysqlBulkExec

Proprits du tMysqlBulkExec
Les composants tMysqlOutputBulk et tMysqlBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tMysqlOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Mysql Le composant tMysqlBulkExec effectue une action dInsert sur les donnes fournies. Le tMysqlBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes MySQL. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Slectionnez la version de MySQL que vous utilisez. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMysqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

639

Proprits du tMysqlBulkExec

Database

Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Action on table Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune action sur la table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Table Nom de la table crire. Une seule table peut tre crite la fois et cette table doit dj exister pour que lopration dInsert soit autorise. Local File Name Chemin daccs et nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Advanced settings Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Lines terminated by Fields terminated by Enclosed by Action on data Caractre ou suite de caractres utiliss pour sparer les lignes. Caractre, chane ou expression rgulire sparant les champs. Caractres entourant les donnes. Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert records in table : Insre de nouveaux enregistrements dans une table. Replace records in table : Remplace les enregistrements existants par de nouveaux. Update records in table : Modifie les enregistrements existants. Ignore records in table : Ignore les enregistrements existants ou insre les nouveaux. Records contain NULL Cochez cette case si vous souhaitez rcuprer les valeurs value nulles du flux dentre. Si vous ne cochez pas cette case,

640

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

les valeurs nulles en entre seront considres comme des champs vides dans le flux de sortie. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant est gnralement utilis avec un composant tMysqlOutputBulk. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes MySQL. n/a

Limitation

Scnarios associs
Pour plus dinformations relatives au fonctionnement de tMysqlBulkExec, consultez les scnarios suivants dans : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du composant tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du composant tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

641

tMysqlClose

tMysqlClose

Proprits du tMysqlClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Mysql Le composant tMysqlClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Mysql. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tMysqlConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant doit tre utilis avec des composants MySQL, notamment avec le tMysqlCommit. n/a

Scnario associ
Ce composant est troitement li aux composants tMysqlConnection et tMysqlRollback. Il est gnralement utilis avec un composant tMysqlConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tMysqlClose, consultez la section intitule tMysqlConnection

642

Guide de Rfrence des Composants Talend Open Studio

tMysqlColumnList

tMysqlColumnList

Proprits du tMysqlColumnList
Famille de composants Fonction Purpose Basic settings Databases/MySQL Le composant tMysqlColumList effectue une opration ditration dans toutes les colonnes dune table donne, grce une connexion MySQL dfinie. Le tMysqlColumList permet de faire une liste des libells des colonnes dune table MySQL donne. Component list Slectionnez le composant tMysqlConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Entrez le nom de la table.

Table name Usage Limitation

Il faut utiliser ce composant en association avec les autres composants MySQL, notamment avec le tMysqlConnection. n/a

Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table
Le scnario Java suivant permet de crer un Job cinq composants. Ce Job permet ditrer une table donne partir dune base de donnes MySQL en utilisant la commande Where et de lister tous les libells des colonnes de la table. Dans la Palette, cliquez sur chacun des composants suivants et dposez-les dans lespace de modlisation : tMysqlConnection, tMysqlTableList, tMysqlColumnList, tFixedFlowInput et tLogRow. Reliez le tMysqlConnection au tMysqlTableList par le biais dun lien OnSubJobOk. Reliez les composants tMysqlTableList, tMysqlColumnList et tFixedFlowInput laide de liens Iterate. Reliez le tFixedFlowInput au tLogRow par le biais dun lien Row Main.

Guide de Rfrence des Composants Talend Open Studio

643

Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table

Dans lespace de modlisation, slectionnez le composant tMysqlConnection et cliquez sur la vue Component pour dfinir les paramtres de base. Dans longlet Basic settings, entrez manuellement les proprits de connexion la base de donnes ou slectionnez-les partir de la liste des variables de contexte : appuyez simultanment sur les touches Ctrl+Espace puis cliquez sur le champ correspondant si vous avez stock les informations en local sous le nud DB Connections du rpertoire Metadata. Pour plus dinformations sur les mtadonnes, veuillez consulter le Guide utilisateur de Talend Open Studio.

Dans cet exemple, connectez-vous une base de donnes MySQL appele customers. Dans lespace de modlisation, slectionnez le composant tMysqlTableList et cliquez sur la vue Component pour dfinir ses paramtres de base.

Dans le champ Component list, slectionnez le composant de connexion MySQL adquat si vous utilisez plus dune connexion. Renseignez la clause Where en utilisant la bonne syntaxe dans le champ correspondant pour itrer les noms de la ou des tables que vous voulez lister dans la console. Dans ce scnario, itrez la table appele customer. Dans lespace de modlisation, slectionnez le composant tMysqlColumnList et cliquez sur la vue Component pour paramtrer ses proprits de base.

Dans le champ Component list, slectionnez le composant de connexion MySQL adquat si vous utilisez plus dune connexion. Dans le champ Table name, saisissez le nom de la table dont vous souhaitez lister les libells de colonnes.

644

Guide de Rfrence des Composants Talend Open Studio

Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table

Dans ce scnario, lobjectif est de lister les libells des colonnes de la table customer. Dans lespace de modlisation, slectionnez le composant tFixedFlowInput et cliquez sur la vue Component pour paramtrer ses proprits de base. Dans le champ Schema, slectionnez loption Built-In et cliquez sur le bouton [...] ct du champ Edit Schema pour dfinir les donnes que vous souhaitez utiliser en entre. Dans ce scnario, le schma est compos de deux colonnes : la premire TableName correspond au nom de la table MySQL et la deuxime ColumnName correspond aux libells des colonnes.

Cliquez sur OK pour fermer la bote de dialogue et une nouvelle bote de dialogue apparat vous demandant si vous souhaitez propager ces modifications, acceptez en cliquant sur Yes. Les colonnes dfinies apparaissent dans le champ Values de la vue Basic settings. Dans le champ Values, cliquez sur chacune des cellules de la colonne Value pour dfinir le contenu des colonnes de la table MySQL et appuyez sur Ctrl+Espace pour accder la liste des variables globales. Dans la liste des variables globales, selectionnez ((String)globalMap.get("tMysqlTableList_1_CURRENT_TABLE")) pour la colonne TableName et ((String)globalMap.get("tMysqlColumnList_1_COLUMN_NAME")) pour la colonne ColumnName. :

Dans lespace de modlisation, slectionnez le composant tLogRow. Cliquez sur la vue Component et paramtrez les proprits de base du tLogRow en fonction de vos besoins. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Le nom de la table MySQL et le libell de ses colonnes sont affichs dans la console.

Guide de Rfrence des Composants Talend Open Studio

645

tMysqlCommit

tMysqlCommit

Proprits du tMysqlCommit
Ce composant est troitement li aux composants tMysqlConnection et tMysqlRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/MySQL Le composant tMysqlCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tMysqlConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tMysqlCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants MySQL et notamment avec les composants tMysqlConnection et tMysqlRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tMysqlConnection et tMysqlRollback. Ils sont gnralement utiliss avec un composant tMysqlConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tMysqlCommit, consultez la section intitule tMysqlConnection .

646

Guide de Rfrence des Composants Talend Open Studio

tMysqlConnection

tMysqlConnection

Proprits du tMysqlConnection
Ce composant est troitement li aux composants tMysqlCommit et tMysqlRollback. Ils sont gnralement utiliss avec un composant tMysqlConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/MySQL Le composant tMysqlConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Table Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Utilisation Limitation Ce composant est gnralement utilis avec des composants MySQL, notamment les composants tMysqlCommit et tMysqlRollback. n/a

Scnario : Insrer des donnes dans des tables mre/ fille


Le Job suivant est ddi des utilisateurs avancs de base de donnes qui souhaitent effectuer des insertions dans des tables multiples laide de lid dune table parent qui alimentera une table enfant. Avant de crer ce Job, suivez les tapes dcrites ci-dessous pour crer les tables ncessaires, laide dun gestionnaire de table tel que innodb.

Guide de Rfrence des Composants Talend Open Studio

647

Scnario : Insrer des donnes dans des tables mre/fille

Dans un diteur de ligne de commande, connectez-vous votre serveur MySQL. Une fois connect la base de donnes correspondante, saisissez la commande suivante afin de crer la table parent : create table f1090_mum(id int not null auto_increment, name varchar(10), primary key(id)) engine=innodb; Puis crez la deuxime table : create table baby (id_baby int not null, years int) engine=innodb; Dans Talend Open Studio, le Job est constitu de sept composants, tMysqlConnection et tMysqlCommit inclus.

Cliquez et dposez les composants suivants de la Palette : tFileList, tFileInputDelimited, tMap, tMysqlOutput (x2). Connectez le composant tFileList au composant dentre tFileInputDelimited laide dune connexion de type Iterate. Ainsi, le nom du fichier traiter sera automatiquement renseign partir de la liste de fichiers du tFileList en utilisant une variable globale. Connectez le composant tFileInputDelimited au tMap et sparez le flux vers deux composants de sortie tMysqlOutput. Utilisez des connexions de type Row pour chacune de ces connexions reprsentant un flux de donnes principal. Dfinissez les proprits du composant tFileList, notamment le rpertoire dans lequel sont stocks les fichiers. Ajoutez le composant tMysqlConnection et connectez-le au composant de dpart de ce Job, (dans cet exemple, le composant tFileList) laide dune connexion OnComponentOk afin de dfinir lordre dexcution. Dans la vue Component du composant tMysqlConnection, dfinissez manuellement les informations de connexion ou rcuprez-les dans le Repository si vous les avez pralablement stockes dans le dossier DB connection du rpertoire Metadata. Pour plus dinformation concernant les Mtadonnes, consultez le Guide Utilisateur de Talend Open Studio. Dans longlet Basic settings du composant tFileInputDelimited, appuyez sur la touche Ctrl+Espace pour accder la liste des variables. Dfinissez le champ File Name avec la variable globale : tFileList_1.CURRENT_FILEPATH

648

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes dans des tables mre/fille

Paramtrez les autres champs comme vous le souhaitez, dfinissez les sparateurs de lignes et de champs (Row et Field Separator) en fonction de la structure de votre document. Puis dfinissez manuellement le schma du fichier laide du bouton Edit schema ou slectionnez le schma dans le Repository. En version Java, assurez-vous que le type de donnes est correctement dfini, conformment la nature des donnes traites. Modifiez lencodage sil ne correspond pas celui de votre fichier. Dans la zone Output du tMap, ajoutez deux tables de sortie, une que vous nommerez mum pour la table parent et une deuxime que vous nommerez baby pour la table enfant. Cliquez sur la colonne Name de la zone Input et glissez-la dans la table mum. Cliquez sur la colonne Years de la zone Input et glissez-la dans la table baby.

Assurez-vous que la table mum est bien au dessus de la table baby car lordre des tables dtermine la squence des flux et ainsi linsertion de base de donnes est excute correctement. Puis slectionnez une connexion de sortie de type Row pour acheminer correctement le flux vers le composant Database de sortie correspondant. Dans longlet Basic settings des deux composants tMysqlOutput, cochez la case Use an existing connection pour rcuprer les informations du composant tMysqlConnection. Ignorez le champ Commit every puisque cette commande sera annule par le composant tMysqlCommit.

Guide de Rfrence des Composants Talend Open Studio

649

Scnario : Insrer des donnes dans des tables mre/fille

Nommez votre table dans le champ Table en vous assurant que vous saisissez la bonne table. Dans cet exemple, la table est soit f1090_mum, soit f1090_baby. Ne dfinissez aucune action dans le champ Action on table puisque les tables ont dj t cres. Slectionnez Insert dans le champ Action on data pour les deux composants de sortie (tMysqlOutput). Cliquez sur le bouton Sync columns pour rcuprer le schma dfini dans le tMap. Modifiez le type dencodage si ncessaire. Dans la zone Additional columns de longlet Advanced settings du composant tMysqlOutput correspondant la table enfant (f1090_baby), dfinissez la colonne id_baby de manire ce que lid de la table parent soit rutilis. Dans le champ SQL expression, saisissez : '(Select Last_Insert_id())' Dans la colonne Position, slectionnez loption Before et dans Reference column, loption years. Ajoutez le composant tMysqlCommit votre Job et connectez-le au composant tFileList laide dune connexion de type OnComponentOk afin que votre Job se termine avec un commit de transaction. Dans la vue Component du tMysqlCommit, slectionnez dans la liste la connexion utiliser. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Lid de la table parent a t rutilis pour alimenter la colonne id_baby.

650

Guide de Rfrence des Composants Talend Open Studio

tMysqlInput

tMysqlInput

Proprits du tMysqlInput
Famille de com- Databases/MySQL posant Fonction Objectif Le composant tMysqlInput lit une base de donnes et en extrait des champs laide de requtes. Le tMysqlInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Use an existing Cochez cette case lorsque vous utilisez le composant tMysqlConnecconnection tion. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de Talend Open Studio. Host Port Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

651

Scnario : Ecrire des colonnes dune base de donnes MySQL dans un fichier de sortie

Database

Nom de la base de donnes.

Username et Pass- Informations dauthentification de lutilisateur de base de donnes. word Schema Schema et Edit Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository). Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Nom de la table lire. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Advanced tings set- Additional parameters JDBC Spcifiez des informations supplmentaires de connexion la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Lorsque vous devez traiter des donnes au format date/heure 0000-00-00 00:00:00 utilisant ce composant, dfinissez les paramtres comme suit : noDatetimeStringSync=true&zeroDateTimeBehavior=convertToNull. Enable stream Cochez cette case pour dterminer avec quelles lignes vous souhaitez travailler. Cette option permet damliorer les performances.

Trim all the String/ Cochez cette case pour supprimer les espaces en dbut et en fin de champ Char columns dans toutes les colonnes contenant des chanes de caractres. Trim column Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Dcochez Trim all the String/Char columns pour activer le tableau Trim column. tStatCatcher Statis- Cochez cette case pour collecter les donnes de log au niveau du comtics posant. Utilisation Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes MySQL.

Scnario : Ecrire des colonnes dune base de donnes MySQL dans un fichier de sortie
Dans ce scnario, vous allez lire des colonnes dune base de donnes MySQL puis les crire dans une table dun fichier local de sortie. Dposez un composant tMysqlInput et un tFileOutputDelimited de la Palette dans lespace de modlisation graphique.

652

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des colonnes dune base de donnes MySQL dans un fichier de sortie

Reliez le tMysqlInput au tFileOutputDelimited laide dun lien Row > Main. Double-cliquez sur le composant tMysqlInput afin douvrir longlet Basic Settings de la vue Component.

Dans la liste Property Type, slectionnez Repository, si vous avez dj stock la connexion la base de donnes dans le nud Metadata du Repository. Les informations de connexion sont alors automatiquement renseignes. Pour plus dinformations concernant le stockage des mtadonnes dans le Repository, consultez le Guide utilisateur de Talend Open Studio. Si vous navez pas stock localement la connexion dans le Repository, slectionnez Built-In dans la liste Property Type puis renseignez manuellement les informations Dans la liste Schema, slectionnez Built-In puis cliquez sur Edit schema pour configurer le schma. Lditeur du schma souvre :

Guide de Rfrence des Composants Talend Open Studio

653

Scnario : Ecrire des colonnes dune base de donnes MySQL dans un fichier de sortie

Cliquez quatre fois sur le bouton

pour ajouter quatre lignes au schma.

Dans les colonnes Column et Db Column, cliquez dans les champs afin de saisir le nom des colonnes correspondantes, id, first_name, city et salary, respectivement. Cliquez sur les champs de la colonne Type pour dfinir le type de donnes. Cliquez sur OK pour fermer lditeur du schma. A ct du champ Table Name, cliquez sur le bouton [...] pour slectionner la table de la base de donnes souhaite. Une bote de dialogue affiche une arborescence de toutes les tables dans la base de donnes slectionne :

Cliquez sur la table qui vous intresse puis sur OK pour fermer la bote de dialogue. Dans la liste Query Type, slectionnez Built-In. Dans le champ Query, saisissez la requte permettant de rcuprer les colonnes souhaites de la table.

Double-cliquez sur le tFileOutputDelimited afin dafficher sa vue Component.

A ct du champ File Name, cliquez sur le bouton [...] afin de parcourir votre systme jusqu lemplacement o vous souhaitez sauvegarder le fichier de sortie, puis saisissez un nom pour le fichier. Cochez la case Include Header afin de rcuprer le nom des colonnes du schma ainsi que les donnes. Sauvegardez le Job et appuyez sur F6 pour lexcuter.

654

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des colonnes dune base de donnes MySQL dans un fichier de sortie

Dans le fichier de sortie est crit le nom des colonnes souhaites et les donnes correspondantes, rcuprs de la base de donnes :

Le Job peut galement tre excut en mode Traces Debug, ce qui vous permet de voir les lignes pendant leur criture dans le fichier de sortie, dans lespace de modlisation graphique.

Guide de Rfrence des Composants Talend Open Studio

655

tMysqlLastInsertId

tMysqlLastInsertId

Proprits du tMysqlLastInsertId
Famille de composant Fonction Objectif Basic settings Databases/MySQL tMysqlLastInsertId affiche les derniers ID ajouts une table partir dune connexion MySQL spcifie. tMysqlLastInsertId permet de rcuprer les cls primaires des entres dernirement ajoutes par un utilisateur une table MySQL. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Component list Advanced settings Utilisation tStatCatcher Statistics Slectionnez le composant tMysqlConnection dans la liste sil y a plus dune connexion dans votre Job. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant intermdiaire. Si vous utilisez ce composant avec un tMysqlOutput , vrifiez que la case Extend Insert de l'onglet Advanced settings est bien dcoche. En effet, Extend Insert permet de faire un chargement par lot, ainsi seul l'ID de la dernire ligne du dernier lot sera retourn.

Limitation

n/a

Scnario : Rcuprer les ID des dernires entres ajoutes


Le scnario Java suivant permet douvrir une connexion une base de donnes MySQL, dy crire des donnes spcifies et enfin de rcuprer les derniers ID ajouts la connexion existante. Cliquez sur chacun des composants suivants et dposez-les dans lditeur graphique : tMysqlConnection, tMysqlCommit, tFileInputDelimited, tMysqlOutput, tMysqlLastInsertId, et tLogRow. Reliez le tMysqlConnection au tFileInputDelimited laide dun lien OnSubJobOk. Reliez le tFileInputDelimited au tMysqlCommit laide dun lien OnSubJobOk.

656

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer les ID des dernires entres ajoutes

Reliez les trois derniers composants au tFileInputDelimited et entre eux laide de liens Row Main, comme suit :

Slectionnez le tMysqlConnection en cliquant dessus partir de lditeur graphique. Cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Dans longlet Basic settings, entrez les paramtres de connexion manuellement ou slectionnez-les partir dune liste de variables de contexte, si vous les avez stockes localement sous le nud DB connections de la partie Metadata (Mtadonnes) du Repository. Vous accderez cette liste en cliquant dans le champ renseigner puis en appuyant sur Ctrl+Espace. Pour plus dinformation sur les Mtadonnes, consultez le Guide Utilisateur de Talend Open Studio.

Slectionnez le tMysqlCommit en cliquant dessus partir de lditeur graphique, puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Dans le champ Component list, slectionnez le composant tMysqlConnection appropri si vous effectuez un Job plusieurs connexions. Slectionnez le tFileInputDelimited en cliquant dessus partir de lditeur graphique. Cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings).

Guide de Rfrence des Composants Talend Open Studio

657

Scnario : Rcuprer les ID des dernires entres ajoutes

Dans la liste Property Type, slectionnez loption Built-In. Renseignez le chemin daccs au fichier traiter dans le champ File Name. Dans cet exemple, le nom du fichier est Customers. Dans le champ Row separator, dfinissez le sparateur de lignes permettant didentifier les fins de ligne. De mme, pour Field separator, dfinissez le sparateur de champs permettant de dlimiter les diffrents champs pour chaque ligne. Dfinissez, si ncessaire, le nombre de lignes den-tte et de pied-de-page ignorer, ainsi que le nombre maximum de lignes que vous souhaitez traiter. Dans cet exemple, le fichier comporte une ligne den-tte. Dans la liste Schema, slectionnez loption Built-In, puis cliquez sur les trois points [...] ct de la mention Edit Schema pour dfinir les donnes passer au composant suivant. Sujets associs : consultez le Guide utilisateur de Talend Open Studio.

Dans ce scnario, le schma se compose de deux colonnes, name et age. La premire colonne comprend le nom des employs et la seconde comporte leurs ges respectifs. Slectionnez le tMysqlOutput en cliquant dessus partir de lditeur graphique. Cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings).

658

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer les ID des dernires entres ajoutes

Cochez la case Use an existing connection. Dans le champ Table, renseignez le nom de la table dans laquelle vous voulez crire la liste des employs. Dans cet exemple, il sagit de la table employee. Slectionnez les actions effectuer dans les champs Action on table et Action on data, partir des listes proposes. Dans cet exemple, neffectuez aucune action sur la table elle-mme mais excutez une action Insert sur les donnes. Dans la liste Schema, slectionnez loption Built-In puis cliquez sur le bouton Sync columns pour synchroniser les colonnes par rapport au composant prcdent. Dans cet exemple, le schma reproduire dans la table de la base de donnes MySQL se compose des deux colonnes name et age.

Slectionnez le tMysqlLastInsertId en cliquant dessus partir de lditeur graphique. Cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings).

Dans le champ Component list, slectionnez le composant tMysqlConnection appropri si vous effectuez un Job plusieurs connexions.

Guide de Rfrence des Composants Talend Open Studio

659

Scnario : Rcuprer les ID des dernires entres ajoutes

Dans la liste Schema, slectionnez loption Built-In puis cliquez sur le bouton Sync columns pour synchroniser les colonnes par rapport au composant prcdent. Dans le schma de sortie du tMySqlLastInsertId, vous pouvez voir la colonne last_insert_id qui indique les dernires ID ajoutes la connexion existante.

Vous pouvez slectionner le type de donnes Long dans la liste droulante Type, dans le cas de nombreuses entres. Slectionnez le tLogRow en cliquant dessus partir de lditeur graphique, puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Pour plus dinformations, consultez le la section intitule tLogRow . Sauvegardez votre Job puis appuyez sur F6 pour lexcuter.

Le composant tMysqlLastInsertId affiche les dernires ID ajoutes pour chaque ligne de la connexion existante.

660

Guide de Rfrence des Composants Talend Open Studio

tMysqlOutput

tMysqlOutput

Proprits du tMysqlOutput
Famille de composant Fonction Objectif Basic settings Databases/MySQL Le composant tMysqlOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tMysqlOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Slectionnez la version de MySQL que vous utilisez. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMysqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

661

Proprits du tMysqlOutput

Host Port Database Username et Password Table Action on table

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Informations dauthentification de lutilisateur de base de donnes Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : Default : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Action on data

Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Insert or update on duplicate key or unique index : Ajouter des entres si la valeur insre n'existe pas ou mettre jour les entres si la valeur insre existe dj et quun risque de violation dune cl unique se prsente. Insert ignore : Ajouter uniquement de nouvelles lignes afin dempcher les erreurs de doublons de cls. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une uti-

662

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMysqlOutput

lisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Extend Insert Cochez cette case pour insrer un ensemble de lignes dfinies au lieu dinsrer les lignes une par une. Cette option permet un important gain de performance. Number of rows per insert : saisissez le nombre de lignes insrer en un bloc. Notez que si vous slectionnez un nombre important de lignes, cela peut augmenter la quantit de mmoire utilise et donc diminuer les performances. Cette option nest pas compatible avec le lien Reject. Vous devez donc la dcocher si vous utilisez un lien Reject en sortie du composant. Use Batch size Cochez cette case afin dactiver le mode batch pour le traitement des donnes. Dans le champ Batch Size qui apparat, vous pouvez saisir le nombre de lignes par lot charger. Cette case est disponible uniquement si vous avez choisi loption Insert, Update, Single Insert Query ou Delete dans le champ Action on data.

Guide de Rfrence des Composants Talend Open Studio

663

Proprits du tMysqlOutput

Commit every

Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tMysqlOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier.

Additional Columns

Use field options Use Hint Options

Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour activer la zone de configuration des indicateurs (ou Hints) permettant doptimiser lexcution dune requte. Dans cette zone, les paramtres sont : - HINT : spcifiez lindicateur dont vous avez besoin, en utilisant la syntaxe /*+ */. - POSITION : spcifiez la place de lindicateur dans une instruction SQL. - SQL STMT : slectionnez linstruction SQL que vous souhaitez utiliser.

Enable debug mode

Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes.

Use duplicate key update Met jour les valeurs des colonnes spcifies en cas de mode insert doublon de la cl primaire. Column : Saisissez entre guillemets le nom de la colonne mettre jour. Value : Saisissez lopration que vous souhaitez effectuer sur la colonne. Pour utiliser cette option, vous devez pralablement slectionner le mode Insert dans la liste Action on data de la vue Basic settings. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL.

664

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Ajouter une colonne et modifier les donnes

Ce composant doit tre utilis en tant que composant de sortie. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes MySQL. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation du tMysqlOutput, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject .

Scnario 1 : Ajouter une colonne et modifier les donnes


Ce scnario Java est un Job trois composants permettant de crer de manire alatoire des donnes de test laide du composant tRowGenerator, dupliquer la colonne modifier laide du composant tMap et de modifier les donnes insrer en utilisant une expression SQL dans le composant tMysqlOutput. Cliquez et dposez les composants suivants dans lditeur graphique : tRowGenerator, tMap et tMysqlOutput. Connectez-les laide de liens Row Main.

Dans lditeur graphique, double-cliquez sur le tRowGenerator pour afficher longlet Basic settings.

Dans la liste Schema, slectionnez loption Built-In. Cliquez sur le bouton [...] ct du champ Edit schema pour dfinir les donnes transmettre au composant tMap, dans ce scnario, les deux colonnes name et random_date.

Guide de Rfrence des Composants Talend Open Studio

665

Scnario 1 : Ajouter une colonne et modifier les donnes

Cliquez sur OK pour fermer la bote de dialogue. Cliquez sur le bouton [...] ct du champ RowGenerator Editor pour ouvrir lditeur du tRowGenerator pour paramtrer les donnes gnrer.

Cliquez dans le champ Functions correspondant et slectionnez une fonction pour chacune des deux colonnes, getFirstName pour la colonne name et getrandomDate pour la colonne random_date. Dans le champ Number of Rows for Rowgenerator, saisissez 10 pour ne gnrer que dix lignes de prnoms et cliquez sur Ok pour fermer lditeur. Double-cliquez sur le composant tMap pour ouvrir lditeur du tMap. Lditeur souvre et affiche les donnes dentre du composant tRowGenerator.

Dans le panneau Schema editor de lditeur du tMap, cliquez sur le bouton [+] de la table de sortie pour ajouter deux lignes et nommez la premire colonne random_date et la deuxime random_date1.

666

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Ajouter une colonne et modifier les donnes

Dans ce scnario, lobjectif est de dupliquer la colonne random_date et adapter le schma afin de modifier les donnes transfrer dans le composant de sortie. Dans lditeur du tMap, glissez la ligne random_date de la table dentre vers les lignes random_date et random_date1 de la table de sortie.

Cliquez sur OK pour fermer lditeur. Dans lditeur graphique, double-cliquez sur le composant tMysqlOutput pour afficher longlet Basic settings et paramtrer ses proprits.

Guide de Rfrence des Composants Talend Open Studio

667

Scnario 1 : Ajouter une colonne et modifier les donnes

Dans la liste Property Type, slectionnez loption Repository et cliquez sur le bouton [...] pour ouvrir la bote de dialogue [Repository content] et slectionnez la connexion la base de donnes adquate. Les informations de connexion sont renseignes automatiquement. Si vous navez pas stock de connexion votre base de donnes sous le nud DB connections sous le nud Metadata du Repository, slectionnez loption Built-in dans la liste Property Type et renseignez les informations de connexion manuellement. Cliquez sur le bouton [...] ct du champ Table et slectionnez la table modifier : la table Dates dans ce scnario. Dans la liste Action on table, slectionnez loption Drop table if exists and create et slectionnez Insert dans la liste Action on data. Si ncessaire, cliquez sur Sync columns pour rcuprer le schma de colonnes du composant tMap. Cliquez sur longlet Advanced settings pour afficher la vue correspondante et dfinir les paramtres avancs du composant.

Dans la zone Additional Columns, paramtrez les modifications appliquer aux colonnes. Dans ce scnario, la colonne One_month_later remplace la colonne random_date_1 et les donnes aussi sont modifies laide dune requte SQL ajoutant un mois la date gnre alatoirement dans la colonne random_date_1. Par exemple : 2007-08-12 devient 2007-09-12. -Saisissez One_Month_Later dans la cellule Name. -Dans la cellule SQL expression, saisissez la requte SQL ajoutant un mois, dans ce scnario : adddate(Random_date, interval 1 month).

668

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Effectuer des mises jour dans une base de donnes

-Slectionnez Replace dans la liste Position. -Slectionnez Random_date1 dans la liste Reference column. Pour ce Job, vous dupliquez la colonne random_date_1 dans la table avant de la remplacer par la colonne One_Month_Later. Le but de cette manipulation tait de voir les modifications apportes en amont. Enregistrez le Job et appuyez sur F6 pour lexcuter. La nouvelle colonne One_month_later remplace la colonne random_date1 dans la base de donnes et ajoute un mois chaque date gnre alatoirement.

Voir galement la section intitule Scnario : Afficher la base de donnes en sortie Scnario : Afficher la base de donnes en sortie, page 397 du composant tDBOutput.

Scnario 2 : Effectuer des mises jour dans une base de donnes


Ce scnario Java est un Job deux composants permettant de mettre jour les donnes dune table MySQL partir dun fichier dlimit. A partir de la Palette, cliquez et dposez les composants tFileInputDelimited et tMysqlOutput dans lditeur graphique puis connectez-les laide dun lien Row Main.

Dans lditeur graphique, double-cliquez sur le tFileInputDelimited pour afficher longlet Basic settings. Dans le champ Property Type, slectionnez le mode Repository si vous avez stock les informations du fichier dlimit sous le nud Metadata du Repository ou slectionnez le mode Built-In pour les dfinir manuellement. Dans ce scnario, utilisez le mode Built-In.

Guide de Rfrence des Composants Talend Open Studio

669

Scnario 2 : Effectuer des mises jour dans une base de donnes

Dans le champ File Name, renseignez manuellement le chemin daccs au fichier contenant les mises jour propager dans la base de donnes ou cliquez sur le bouton [...] pour parcourir vos dossiers jusqu ce fichier. Dans cet exemple, utilisez le fichier customer_update, qui comporte quatre colonnes, id, CustomerName, CustomerAddress et idState.

Dfinissez si ncessaire les sparateurs de lignes (Row separator) et de champs (Field separator), len-tte (Header) et le pied-de-page (Footer), ainsi que le nombre de lignes traiter (Limit). La premire ligne, qui porte le nom des colonnes, est ignore dans cet exemple, cest pourquoi le champ Header est dfini 1. Dans le champ Schema, slectionnez le mode Built in puis cliquez sur le bouton [...] ct du champ Edit Schema pour dfinir les donnes passer au composant suivant. Dans cet exemple, le schma est constitu de quatre colonnes, id, CustomerName, CustomerAddress et idState.

Devant le nom de chaque colonne se trouve une case Key. Cochez cette case pour la ou les colonne(s) que vous voulez dfinir comme cl. Vous devez obligatoirement dfinir au moins une cl pour que le Job sexcute. Dans le cas contraire, le Job sarrte automatiquement et un message derreur saffiche dans la console de log. Dans lditeur graphique, double-cliquez sur le composant tMysqlOutput pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

670

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Effectuer des mises jour dans une base de donnes

Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Vous pouvez cliquer sur le bouton [...] ct du champ Edit schema pour consulter le schma et vrifier quau moins une colonne a t dfinie comme cl. Dans le champ Property Type, slectionnez Repository si vous avez stock les informations de connexion la base de donnes sous le nud Metadata du Repository ou slectionnez le mode Built-In, puis renseignez manuellement les champs suivants : Host, Port, Database, Username et Password. Dans le champ Table, saisissez le nom de la table mettre jour. Dans le champ Action on table, slectionnez lopration que vous souhaitez effectuer sur la table. Pour ce scnario, slectionnez None car la table existe dj. Dans le champ Action on data, slectionnez lopration que vous souhaitez effectuer sur les donnes. Pour ce scnario, slectionnez loption Update pour mettre la table jour. Enregistrez le Job puis appuyez sur F6 pour lexcuter.

A partir de votre explorateur de base de donnes, vous pouvez vrifier que la table customers a bien t mise jour. Comme avant sa mise jour, elle se prsente sous la forme des quatre colonnes id, CustomerName, CustomerAddress et idState, mais certains champs ont t modifis selon les donnes du fichier dlimit customer_update.

Guide de Rfrence des Composants Talend Open Studio

671

Scnario 3 : Rcuprer les donnes errones laide dun lien Reject

Scnario 3 : Rcuprer les donnes errones laide dun lien Reject


Ce scnario dcrit un Job quatre composants effectuant une migration dun fichier client vers la table dune base de donnes MySQL et redirigeant les donnes errones vers un fichier CSV laide dun lien Reject.

Dans le Repository, slectionnez la mtadonne correspondant au fichier client que vous souhaitez migrer et glissez-la dans lespace de modlisation. Dans la bote de dialogue [Components], slectionnez tFileInputDelimited et cliquez sur OK. Les proprits du composant seront automatiquement renseignes. Si vous navez pas enregistr les informations concernant votre fichier client sous le nud Metadata du Repository. Glissez un composant tFileInputDelimited de la famille File > Input de la Palette et renseignez ses proprits manuellement dans la vue Component. A partir de la Palette, glissez un composant tMap de la famille Processing dans lespace de modlisation. Dans le Repository, dveloppez le nud Metadata et Db Connections, et slectionnez la mtadonne de connexion la base de donnes dans laquelle vous souhaitez migrer vos donnes et glissez-la dans lespace de modlisation. Dans la bote de dialogue [Components], slectionnez tMysqlOutput et cliquez sur OK. Les proprits de connexion la base de donnes seront automatiquement renseignes. Si vous navez pas enregistr les informations de connexion votre base de donnes sous le nud Db Connections du Repository. Glissez un composant tMysqlOutput de la famille Databases de la Palette et renseignez ses proprits manuellement dans la vue Component. Pour plus dinformations, consultez le Guide utilisateur Talend Open Studio. A partir de la Palette, slectionnez un composant tFileOutputDelimited de la famille File > Output et glissez-le dans lespace de modlisation. Reliez les composant customers et tMap, et les composants tMap et Localhost laide dun lien de type Row Main. Vous nommerez ce deuxime lien out. Reliez le composant Localhost au tFileOutputDelimited laide dun lien de type Row > Reject. Double-cliquez sur le composant customers pour afficher la vue Component correspondante.

672

Guide de Rfrence des Composants Talend Open Studio

Scnario 3 : Rcuprer les donnes errones laide dun lien Reject

Dans la liste Property Type, slectionnez le mode Repository puis cliquez sur le bouton [...] correspondant pour slectionner la mtadonne contenant la connexion votre fichier. Sinon, slectionnez le mode Built-in et paramtrez manuellement les champs suivants. Cliquez sur le bouton [...] ct du champ File Name, et indiquez le chemin daccs et le nom du fichier utiliser. Dans les champs Row et Field Separator, saisissez entre guillemets les sparateurs de lignes et de champs utiliss dans le fichier. Dans les champs Header, Footer et Limit, saisissez le nombre de ligne den-tte et de pied-de-page ignorer, ainsi que le nombre de ligne limite traiter. Dans la liste Schema, slectionnez Repository et cliquez sur le bouton [...] correspondant pour slectionner le schma de votre fichier, sil est stock sous le nud Metadata du Repository. Sinon cliquez sur le bouton [...] correspondant au champ Edit schema et dfinissez manuellement le schma de votre fichier. Le schma se prsente comme suit :

Double-cliquez sur le tMap afin douvrir son diteur.

Guide de Rfrence des Composants Talend Open Studio

673

Scnario 3 : Rcuprer les donnes errones laide dun lien Reject

Slectionnez les colonnes id, CustomerName, CustomerAddress, idSate, id2, RegTime, RegisterTime de la zone de gauche et glissez-les dans la table out de la zone de droite.

Dans la zone Schema editor en bas de lditeur du tMap, dans le tableau droite, changez la longueur de la colonne CustomerName en 28 afin de crer une erreur. Ainsi, les donnes dont la longueur est suprieure 28 creront des erreurs qui pourront tre rcupres grce au lien Reject. Cliquez sur OK. Dans lespace de modlisation, double-cliquez sur le composant de sortie Localhost pour afficher la vue Component correspondante.

674

Guide de Rfrence des Composants Talend Open Studio

Scnario 3 : Rcuprer les donnes errones laide dun lien Reject

Dans la liste Property Type, slectionnez le mode Repository puis cliquez sur le bouton [...] correspondant pour slectionner la mtadonne de connexion la base de donnes. Les informations de connexion sont renseignes automatiquement. Sinon, slectionnez le mode Built-in et paramtrez ces champs manuellement. Dans le champ Table, saisissez le nom de la table crer. Dans ce scnario, vous lappelez customers_data. Dans la liste Action on data, slectionnez loption Create table. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Assurez-vous que la case Die on error est bien dcoche, afin que le Job sexcute malgr lerreur que vous venez de crer. Cliquez sur longlet Advanced settings de la vue Component pour paramtrer les paramtres avancs du composant.

Dcochez la case Extend Insert permettant dinsrer des lignes par bloc car cette option nest pas compatible avec le lien Reject. Double-cliquez sur le composant tFileOutputDelimited pour paramtrer ses proprits dans la vue Component.

Guide de Rfrence des Composants Talend Open Studio

675

Scnario 3 : Rcuprer les donnes errones laide dun lien Reject

Cliquez sur le bouton [...] ct du champ File Name pour indiquer le rpertoire de destination et le nom du fichier de sortie. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Les donnes en erreur sont envoyes dans le fichier dlimit, ainsi que le type derreur rencontre. Ici, vous avez affaire des donnes tronques : Data truncation.

676

Guide de Rfrence des Composants Talend Open Studio

tMysqlOutputBulk

tMysqlOutputBulk

Proprits du tMysqlOutputBulk
Les composants tMysqlOutputBulk et tMysqlBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tMysqlOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/MySQL Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards MySQL. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes MySQL. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Text enclosure Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Caractres utiliss pour entourer le texte.

Create directory if does Cette case est coche par dfaut. Cette option permet de not exist crer le dossier contenant le fichier de sortie sil nexiste pas dj. Custom the flush buffer Cochez cette case pour personnaliser la taille de la msize moire utilise pour stocker temporairement les don-

Guide de Rfrence des Composants Talend Open Studio

677

Scnario : Insrer des donnes transformes dans une base MySQL

nes, et dans le champ Row number, saisissez le nombre de lignes aprs lesquelles la mmoire est nouveau libre. Records contain NULL Cette case est coche par dfaut. Elle permet de prendre value les champs de valeur NULL en compte. Si vous la dcochez, les valeurs NULL seront remplaces par des valeurs vides. Check disk space Encoding Cochez cette case afin de retourner une erreur Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant est gnralement utilis avec le composant tMysqlBulkExec. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes MySQL.

Scnario : Insrer des donnes transformes dans une base MySQL


Ce scnario dcrit un Job contenant quatre composants dont le but est dalimenter un base MySQL partir dun fichier paramtres contenant des donnes transformes. Deux tapes sont requises pour ce Job, dune part pour crer le fichier paramtres qui sera utilis dans un second temps. La premire tape inclut une phase de transformation des donnes contenues dans le fichier.

Glissez et dposez les composants suivants : tRowGenerator, tMap, tMysqlOutputBulk et tMysqlBulkExec dans lespace de modlisation. Connectez le flux principal laide de connexions Row > Main. Connectez le composant de dbut (tRowGenerator, dans cet exemple) au composant tMysqlBulkExec laide dune connexion trigger de type OnSubjobOk. Un composant tRowGenerator est utilis pour gnrer des donnes de faon alatoire. Double-cliquez sur le composant tRowGenerator pour lancer lditeur. Dfinissez le schma des lignes gnrer et la nature des donnes gnrer. Dans cet exemple, le fichier clients crer contient les colonnes suivantes : ID, First Name, Last name, Address, City qui sont toutes de type chane de caractres (string) lexception de lID qui est de type entier (integer).

678

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes transformes dans une base MySQL

Certaines informations du schma nont pas ncessairement besoin dtre affiches. Pour les dissimuler, cliquez sur le bouton Columns dans la barre doutils et dcochez les colonnes cacher, par exemple : Precision ou Parameters. Utilisez le bouton [+] pour ajouter autant de colonnes que possible votre schma. Cliquez sur le bouton Refresh en haut droite de lditeur pour visualiser un aperu des lignes gnres en sortie dans longlet Preview en bas de lditeur. Cliquez sur OK pour valider. Dans lespace de modlisation, double-cliquez sur le composant tMap pour ouvrir son diteur et paramtrer la transformation. Faites glisser toutes les colonnes de la table dentre (row1) vers la table de sortie (clients).

Appliquez la transformation sur la colonne LastName en ajoutant .toUpperCase() la fin. Cela mettra les noms des clients en majuscule. Cliquez sur OK pour valider la transformation. Dans lespace de modlisation, double-cliquez sur le composant tMysqlOutputBulk pour afficher sa vue Component et paramtrer ses proprits. Dfinissez le chemin daccs et le nom du fichier produire dans le champ File Name. Si les proprits du fichier dlimit sont conserves dans le Repository, slectionnez lentre correspondante dans le champ Property type afin de les rcuprer. Dans cet exemple, le nom de fichier est clients.txt.

Guide de Rfrence des Composants Talend Open Studio

679

Scnario : Insrer des donnes transformes dans une base MySQL

Le schma est propag partir du composant tMap, si vous cliquez sur Yes lorsque la bote de dialogue vous demande de confirmer la propagation. Sinon, cliquez sur le bouton Sync columns pour rcuprer le schma. Dans cet exemple, nincluez pas les informations den-tte, puisque la table doit dj les contenir. Lencodage est celui par dfaut dans ce scnario. Cliquez sur OK pour valider la sortie. Double-cliquez sur le composant tMysqlBulkExec pour paramtrer la requte INSERT excuter.

Dfinissez les informations de connexion la base de donnes. Nous vous recommandons de conserver ce type dinformations dans le Repository, afin de pouvoir les rcuprer tout moment et pour tous vos Jobs. Dans le champ Table, saisissez le nom de la table alimenter, ici, clients. Dans longlet Advanced settings, saisissez le sparateur de colonnes, dans le champ Fields terminated by. Vrifiez que lencodage dfini dans le champ Encoding correspond celui de vos donnes. Appuyez sur F6 pour excuter le Job.

La table de la base clients est alimente avec les donnes du fichier notamment les donnes transformes dans la colonne Last name. Pour une simple opration dInsert ne ncessitant pas de transformation, lutilisation du composant tMysqlOutputBulkExec permet dconomiser une tape dans le processus et ainsi de gagner en performance. Voir galement la section intitule Proprits du tMysqlOutputBulkExec .

680

Guide de Rfrence des Composants Talend Open Studio

tMysqlOutputBulkExec

tMysqlOutputBulkExec

Proprits du tMysqlOutputBulkExec
Les composants tMysqlOutputBulk et tMysqlBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tMysqlOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/MySQL Le tMysqlOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tMysqlOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes MySQL. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Host Port Database Slectionnez la version de MySQL que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Action on table Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectue aucune action sur la table. Drop and create the table : supprime la table puis en crer une nouvelle. Create a table : cre une table qui nexiste pas encore. Create table if doesnt exist : cre la table si ncessaire. Clear a table : supprime le contenu de la table. Table Nom de la table crire. Une seule table peut tre crite la fois et cette table doit dj exister pour que lopration dInsert soit autorise. Local File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

681

Proprits du tMysqlOutputBulkExec

Append

Cochez cette option pour ajouter de nouvelles lignes la fin du fichier.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Advanced settings Additional JDBC Para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Row separator Field separator Text enclosure Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Caractres entourant les donnes.

Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Custom the flush buffer Cochez cette case pour personnaliser la taille de la msize moire utilise pour stocker temporairement les donnes, et dans le champ Row number, saisissez le nombre de lignes aprs lesquelles la mmoire est nouveau libre. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert records in table : Insre de nouveaux enregistrements dans une table. Replace records in table : Remplace les enregistrements existants par de nouveaux. Update records in table : Modifie les enregistrements existants. Ignore records in table : Ignore les enregistrements existants ou insre les nouveaux. Records contain NULL Cette case est coche par dfaut. Elle permet de prendre les value champs de valeur NULL en compte. Si vous la dcochez, les valeurs NULL seront remplaces par des valeurs vides. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

682

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes dans une base MySQL

Scnario : Insrer des donnes dans une base MySQL


Ce scnario est un Job deux composants qui effectue le mme type dopration dalimentation que les composants tMysqlOutputBulk (consultez la section intitule tMysqlOutputBulk ) et tMysqlBulkExec (consultez la section intitule tMysqlBulkExec ), mais sans transformation de donnes.

Cliquez et dposez les composants suivants : tRowGenerator et tMysqlOutputBulkExec. Connectez les composants via un lien de type Row > Main. Paramtrez le tRowGenerator de la mme manire que dans la section intitule Scnario : Insrer des donnes transformes dans une base MySQL . Le schma est constitu de plusieurs colonnes notamment : ID, First Name, Last Name, Address et City. A partir de lespace de modlisation, double-cliquez sur le composant tMysqlOutputBulkExec pour afficher la vue Component et paramtrer ses proprits.

Paramtrez la connexion la base de donnes si ncessaire, en suivant les recommandations dans la section intitule Scnario : Insrer des donnes transformes dans une base MySQL , concernant la conservation des informations de connexion dans la partie Metadata du Repository. Pour cela, slectionnez Repository dans le champ Property Type et slectionnez la connexion adquate dans le champ adjacent. Les champs suivants seront renseigns automatiquement. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio. Dans le champ Action on table, slectionnez loption None puisque vous souhaitez insrer les donnes dans une table dj existante. Dans le champ Table, saisissez le nom de la table alimenter, ici, clients. Dans le champ Local filename, indiquez le chemin daccs et le nom du fichier contenant les donnes charger dans la table, ici, clients.txt. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Cliquez sur longlet Advanced settings pour paramtrer les proprits avances du composant.

Guide de Rfrence des Composants Talend Open Studio

683

Scnario : Insrer des donnes dans une base MySQL

Dans la liste Action on data, slectionnez loption Insert records in table pour insrer ces nouvelles donnes dans la table. Appuyez sur F6 pour excuter le Job Le rsultat devrait tre relativement identique celui obtenu dans la section intitule Scnario : Insrer des donnes transformes dans une base MySQL . Cependant les donnes elles-mmes peuvent diffrer lgrement puisque les donnes sont regnres de faon alatoire chaque excution.

684

Guide de Rfrence des Composants Talend Open Studio

tMysqlRollback

tMysqlRollback

Proprits du tMysqlRollback
Ce composant est troitement li aux composants tMysqlCommit et tMysqlConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/MySQL Le tMysqlRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tMysqlConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants MySQL, notamment les composants tMysqlConnection et tMysqlCommit. n/a

Scnario : Annuler linsertion de donnes dans des tables mre/fille


En vous basant sur la section intitule Scnario : Insrer des donnes dans des tables mre/fille du composant tMysqlConnection, insrez une opration de rollback (annulation) afin dviter un commit inutile.

Cliquez et dposez un composant tMysqlRollback et connectez-le au composant de dbut. Paramtrez lunique champ du Rollback avec la connexion la base de donnes adquate. Ce nouvel lment ajout au Job assure que la transaction ne sera pas commite partiellement.

Guide de Rfrence des Composants Talend Open Studio

685

tMysqlRow

tMysqlRow

Proprits du tMysqlRow
Famille de composant Fonction Databases/MySQL tMysqlRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tMysqlRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Slectionnez la version de MySQL que vous utilisez. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMySQLConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Objectif

Basic settings

686

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMysqlRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Guess Query Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Query

Die on error

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre.

Guide de Rfrence des Composants Talend Open Studio

687

Scnario 1 : Supprimer et re-gnrer un index de table MySQL

Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnario 1 : Supprimer et re-gnrer un index de table MySQL


Le scnario suivant cre un Job quatre composants permettant de supprimer un index de table, effectuer un Insert dans cette table avant de re-gnrer lindex.

Slectionnez les composants suivants dans la Palette et dposez-le dans lespace de modlisation : tMysqlRow (x2), tRowGenerator, tMysqlOutput. Connectez le composant tMysqlIntput au tRowGenerator. Puis laide dune connexion OnComponentOk, connectez le premier composant tMysqlRow au tMysqlInput. Connectez le composant tRowGenerator au second composant tMysqlRow laide dune connexion OnSubjobOk. Slectionnez le composant tMysqlRow et renseignez les proprits de la base de donnes dans longlet Basic settings. Dans les champs Property type et Schema, slectionnez la base de donnes approprie dans la liste. Les dtails de connexion la base de donnes ainsi que le schma de la table sont renseigns automatiquement. Propagez les informations de proprits et de schma aux autres composants du Job.

688

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Utiliser linstance PreparedStatement pour faire une requte sur des donnes

La requte tant conserve dans les Metadata du Repository, vous pouvez galement slectionner Repository dans le champ Query type et cliquer sur la requte correspondante. Si vous ne conservez pas vos requtes dans le Repository, saisissez la dclaration SQL suivante : drop index <index_name> on <table_name> Puis slectionnez le deuxime composant tMysqlRow, vrifiez les proprits et le schma de base de donnes. Puis saisissez la dclaration SQL permettant de recrer un index laide de la formulation suivante : create index <index_name> on <table_name> (<column_name>); Le composant tRowGenerator permet de gnrer automatiquement les colonnes ajouter la table de sortie dfinie. Slectionnez le composant tMysqlOutput et renseignez les proprits de connexion la base de donnes soit partir du Repository ou manuellement si les informations de connexion ne sont utilises que pour ce Job. La table alimenter a pour nom : comprehensive. Le schma est automatiquement hrit du flux de donnes du tLogRow. Editez le schma et vrifiez que sa structure correspond au schma attendu par la table de base de donnes spcifie. Dans le champ Action on table, slectionnez None et dans le champ Action on data, slectionnez Insert. Aucune colonne supplmentaire nest requise pour ce Job. Appuyez sur F6 pour excuter ce Job. Si vous avez la possibilit dobserver laction sur la base de donnes, remarquez que lindex a t supprim en dbut de Job puis recr la fin de laction dInsert. Voir galement la section intitule tDBSQLRow .

Scnario 2 : Utiliser linstance PreparedStatement pour faire une requte sur des donnes
Le scnario suivant dcrit un Job quatre composants permettant de mettre en correspondance la colonne dune table avec un fichier clients. En effet, la table MySQL contient la liste de tous les Etats amricains avec leur identifiant, et le fichier contient des informations sur vos clients avec lidentifiant de ltat dans lequel ils rsident. Lobjectif de ce scnario est de rcuprer le nom de lEtat pour chaque client laide dune requte SQL. Afin de traiter un grand nombre de donnes plus rapidement, utilisez linstance PreparedStatement permettant de nexcuter quune seule fois la requte au lieu de leffectuer chaque ligne, puis chaque ligne de donnes est envoy en paramtre. Pour ce scnario, utilisez un fichier et une base de donnes dont vous avez pralablement stock la connexion et les proprits dans des mtadonnes dans le Repository. Pour plus dinformations concernant la cration de mtadonnes de fichiers dlimits, la cration de mtadonnes de connexion une base de donnes et lutilisation de ces mtadonnes, consultez le Guide utilisateur Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

689

Scnario 2 : Utiliser linstance PreparedStatement pour faire une requte sur des donnes

A partir du Repository, dveloppez le nud Metadata et File delimited Slectionnez la mtadonne correspondant au fichier clients que vous souhaitez utiliser dans ce Job. Ici, vous utilisez la mtadonne customers. Glissez cette mtadonne dans lespace de modlisation et double-cliquez sur tFileInputDelimited dans la bote de dialogue Components afin de crer un composant tFileInputDelimited dj paramtr.

Dans la liste Schema, slectionnez Built-in afin de modifier le schma de votre composant. Puis, cliquez sur le bouton [...] ct du champ Edit schema pour ajouter la colonne dans laquelle insrer le nom de lEtat.

Cliquez sur le bouton [+] pour ajouter une colonne au schma. Renommez cette colonne LabelStateRecordSet, et elle est de type objet, donc slectionnez Object dans la liste Type. Cliquez sur OK pour enregistrer vos modifications. A partir de la Palette, slectionnez les composants tMysqlRow, tParseRecordSet et tFileOutputDelimited et glissez-les dans lespace de modlisation. Reliez les quatre composants via des liens de type Row > Main. Double-cliquez sur le composant tMysqlRow pour paramtrer ses proprits dans longlet Basic settings de la vue Component.

690

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Utiliser linstance PreparedStatement pour faire une requte sur des donnes

Dans la liste Property Type, slectionnez Repository et cliquez sur le bouton [...] pour slectionner la connexion la base de donnes centralise dans les mtadonnes du Repository. Les champs DB Version, Host, Port, Database, Username et Password sont renseigns automatiquement. Si vous tes en mode Builtin, renseignez ces champs manuellement. Dans la liste Schema, slectionnez Built-in pour paramtrer le schma manuellement et ajouter la colonne LabelStateRecordSet, ou cliquez directement sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Dans le champ Query, saisissez la requte SQL utiliser. Ici, vous souhaitez rcuprer les noms des Etats amricains contenus dans la colonne LabelState de la table MySQL us_state : "SELECT LabelState FROM us_state WHERE idState=?". Le point dinterrogation ? reprsente le paramtre dfinir dans longlet Advanced settings. Cliquez sur longlet Advanced settings pour paramtrer les proprits avances du composant.

Cochez la case Propagate QUERYs recordset et slectionnez la colonne LabelStateRecordSet dans la liste use column pour insrer le rsultat de la requte dans cette colonne.

Guide de Rfrence des Composants Talend Open Studio

691

Scnario 2 : Utiliser linstance PreparedStatement pour faire une requte sur des donnes

Cochez la case Use PreparedStatement et dfinissez le paramtre utilis dans la requte dans le tableau Set PreparedStatement Parameters. Cliquez sur le bouton [+] pour ajouter un paramtre. Dans la cellule Parameter Index, saisissez la position du paramtre dans linstruction SQL. Saisissez 1 tant donn que vous nutilisez quun seul paramtre dans lexemple. Dans la cellule Parameter Type, saisissez le type du paramtre. Ici, le paramtre est de type entier, donc slectionnez Int dans la liste. Dans la cellule Parameter Value, saisissez la valeur du paramtre. Ici, vous souhaitez rcuprer le nom de lEtat en fonction de leur ID pour chaque client du fichier dentre, saisissez donc row1.idState. Double-cliquez sur le composant tParseRecordSet pour paramtrer ses proprits dans longlet Basic settings de la vue Component.

Dans la liste Prev. Comp. Column list, slectionnez la colonne du composant prcdent analyser. Dans cet exemple, slectionnez la colonne LabelStateRecordSet. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent et le tableau Attribute table est automatiquement renseign avec les colonnes du schma. Dans le tableau Attribute table, dans le champ Value correspondant la colonne LabelStateRecordSet, saisissez entre guillemets le nom de la colonne contenant le nom des Etats rcuprer et mettre en correspondance avec chaque client. Dans cet exemple, saisissez LabelState. Double-cliquez sur le composant tFileOutputDelimited pour paramtrer ses proprits dans longlet Basic settings de la vue Component.

692

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Utiliser linstance PreparedStatement pour faire une requte sur des donnes

Dans le champ File Name, renseignez le chemin daccs et le nom du fichier de sortie. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Une colonne contenant le nom de lEtat amricain correspondant chaque client a t ajoute au fichier.

Guide de Rfrence des Composants Talend Open Studio

693

tMysqlSCD

tMysqlSCD

Le composant tMysqlSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tMysqlSCD .

694

Guide de Rfrence des Composants Talend Open Studio

tMysqlSCDELT

tMysqlSCDELT

Le composant tMysqlSCDELT appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tMysqlSCDELT .

Guide de Rfrence des Composants Talend Open Studio

695

tMysqlSP

tMysqlSP

Proprits du tMysqlSP
Familles de composant Fonction Objectif Basic settings Databases/Mysql Le composant tMysqlSP appelle une procdure stocke de base de donnes. Le tMysqlSP permet de centraliser des requtes multiples ou complexes dans une base de donnes et de les appeler plus facilement. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier des proprits du composant. Les champs suivants sont alors pr-remplis. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tMysqlConnection. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification sur lutilisateur de base de donnes. Schema et Edit Schema Dans une procdure stocke, le schma est un paramtre dentre. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il est rutilisable. Voir galement le Guide utilisateur de Talend Open Studio. SP Name Saisissez le nom exact de la Procdure Stocke (SP). Is Function / Return re- Cochez cette case, si une seule valeur doit tre retourne. sult in Slectionnez dans la liste la colonne du schma sur laquelle est base la valeur obtenir. Parameters Cliquez sur le bouton [+] et slectionnez dans le champ Schema Columns les diffrentes colonnes ncessaires la procdure. Notez que le schma de la SP peut contenir plus de colonnes quil ny a de paramtres utiliss dans la procdure. Slectionnez le Type de paramtre : IN : paramtre dentre (Input)

696

Guide de Rfrence des Composants Talend Open Studio

Scnario : Trouver le libell State laide dune procdure stocke

OUT : paramtre de sortie (Output)/valeur retourne IN OUT : les paramtres dentre doivent tre retournes sous forme de valeur, mme aprs modifications via la procdure (fonction). RECORDSET : les paramtres dentre doivent tre retournes sous forme densemble de valeurs, au lieu dune valeur unique. Consultez la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL. Utilisation Limitation Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut. Dans ce cas, seuls les paramtres dentre sont autoriss. La syntaxe de la Procdure Stocke doit correspondre celle de la base de donnes.

Scnario : Trouver le libell State laide dune procdure stocke


Le Job suivant a pour but de trouver les libells State en fonction des ID impairs de la colonne State dune table MySQL deux colonnes laide dune procdure stocke.

Cliquez et dposez les composants suivants dans lespace de modlisation : tRowGenerator, tMysqlSP et tLogRow. Connectez les composants laide dune connexion de type Row Main. Le tRowGenerator est utilis pour gnrer des ID impairs. Double-cliquez sur le composant pour lancer lditeur.

Cliquez sur le bouton [+] pour ajouter une colonne au schma gnrer.

Guide de Rfrence des Composants Talend Open Studio

697

Scnario : Trouver le libell State laide dune procdure stocke

Cochez la case Key pour dfinir lentre comme tant une cl primaire et dfinissez le Type en Int (entier). Dans le champ Length, la longueur est de 2 chiffres au maximum. Utilisez la fonction prtablie appele sequence mais modifiez les paramtres dans la partie infrieure de la fentre.

Modifiez la valeur (Value) de step : de 1 2 pour cet exemple. Mais la valeur de dpart (start value) reste 1. Dans le champ Number of generated rows, dfinissez le nombre de lignes gnrer 25, afin que tous les ID impairs de State (il y a 50 Etats) soient gnrs. Cliquez sur OK pour valider la configuration. Puis slectionnez le composant tMysqlSP et paramtrez ses proprits.

Dans le champ Property type, slectionnez loption Repository puis slectionnez lentre correspondante dans la liste. Les informations de connexion sont remplies automatiquement. Sinon, paramtrez les informations de connexion manuellement.

698

Guide de Rfrence des Composants Talend Open Studio

Scnario : Trouver le libell State laide dune procdure stocke

Cliquez sur Sync Column pour rcuprer le schma gnr du composant prcdent. Puis cliquez sur Edit Schema et ajoutez une colonne supplmentaire contenant les libells des Etats (State) obtenir en sortie, en plus de lID. Slectionnez le type dencodage dans la liste. Dans le champ SP Name, saisissez le nom de la procdure comme il a t dfini dans la base de donnes (ici, getstate). La procdure excuter correspond : DROP PROCEDURE IF EXISTS `talend`.`getstate` $$ CREATE DEFINER=`root`@`localhost` PROCEDURE `getstate`(IN pid INT, OUT pstate VARCHAR(50)) BEGIN SELECT LabelState INTO pstate FROM us_states WHERE idState = pid; END $$ Dans la zone Parameters, cliquez sur le bouton [+] pour ajouter une ligne la table. Dfinissez le champ Column en ID, et le champ Type en IN, ainsi il sera considr comme paramtre dentre dans la procdure. Ajoutez une deuxime ligne et dfinissez le champ Column en State et le champ Type en Out, ainsi il sera considr comme le paramtre de sortie a retourne. Et enfin, paramtrez les proprits du composant tLogRow.

Synchronisez le schma avec celui du composant prcdent en cliquant sur le bouton Sync columns. Et cochez la case Print values in cells of a table pour un meilleur confort de lecture. Puis enregistrez votre Job et excutez-le.

Guide de Rfrence des Composants Talend Open Studio

699

Scnario : Trouver le libell State laide dune procdure stocke

La sortie affiche les diffrents Etats (State) avec leur ID impair comme dfini dans la procdure. Consultez galement la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL.

700

Guide de Rfrence des Composants Talend Open Studio

tMysqlTableList

tMysqlTableList

Proprits du tMysqlTableList
Famille de composant Fonction Objectif Basic settings Databases/MySQL Le composant tMysqlTableList effectue une opration ditration sur toutes les tables dune base de donnes, grce une connexion MySQL dfinie. Le composant tMysqlTableList permet de lister les noms des tables MySQL grce aux commandes SELECT et WHERE. Component list Slectionnez le composant tMysqlConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours.

Where clause for table Saisissez la commande WHERE permettant didentifier name selection les tables sur lesquelles effectuer lopration ditration. Utilisation Limitation Vous pouvez utiliser ce composant en association avec les autres composants MySQL, notamment avec le tMysqlConnection. n/a

Scnario : Effectuer une opration ditration sur des tables et en effacer le contenu grce un modle SQL dfini par lutilisateur (SQL Template)
Le scnario Java suivant dcrit un Job trois composants qui permet deffectuer une opration ditration, dans les tables spcifies dune base de donnes MySQL, en utilisant une clause de type WHERE. Le Job permet ensuite deffacer le contenu de ces tables directement sur le SGBD grce un modle SQL (SQL Template) dfini par lutilisateur. Pour une utilisation avance, commencez par crer une connexion la base de donnes qui contient les tables que vous voulez vider de leur contenu. Dans la vue en arborescence du Repository, dveloppez le nud Metadata puis cliquez droit sur DB Connections pour crer une connexion la base de donnes de travail et stocker les informations de connexion en local. Pour plus dinformations sur les mtadonnes (metadata), consultez le Guide utilisateur de Talend Open Studio. Sinon, dposez un composant tMysqlConnection dans lditeur graphique et renseignez les paramtres de connexion manuellement. A partir du Repository, dposez dans lditeur graphique la connexion que vous venez de crer. La bote de dialogue [Components] saffiche lcran. Slectionnez le composant tMysqlConnection puis cliquez sur OK.

Guide de Rfrence des Composants Talend Open Studio

701

Scnario : Effectuer une opration ditration sur des tables et en effacer le contenu grce un modle SQL dfini par lutilisateur (SQL Template) Le composant tMysqlConnection apparait alors dans lditeur graphique et les paramtres de connexion, accessibles depuis la vue Basic settings, sont automatiquement renseigns. A partir de la Palette, cliquez-dposez les composants tMysqlTableList et tELT dans lditeur graphique. Reliez les composants tMysqlConnection et tMysqlTableList laide dun lien Trigger de type OnSubJobOk.

Reliez les composants tMysqlTableList et tELT laide dun lien de type Iterate. Double-cliquez sur le tMysqlConnection pour afficher la vue Basic settings du composant si vous voulez en vrifier les paramtres de connexion.

Dans cet exemple, connectez-vous une base de donnes MySQL appele examples. Dans lditeur graphique, double-cliquez sur le composant tMysqlTableList pour en afficher les paramtres de bases et les dfinir (vue Basic settings).

Slectionnez la connexion MySQL approprie partir de la liste droulante Component list, dans le cas o vous utilisez plus dune connexion. Renseignez la clause de type WHERE dans le champ appropri, en veillant utiliser la bonne syntaxe, pour effectuer une itration sur la ou les tables dont vous voulez effacer le contenu. Dans ce scnario, oprez litration sur toutes les tables dont le nom commence par ex. Dans lditeur graphique, double-cliquez sur le composant tELT pour en afficher les paramtres de base et les dfinir (vue Basic settings).

702

Guide de Rfrence des Composants Talend Open Studio

Scnario : Effectuer une opration ditration sur des tables et en effacer le contenu grce un modle SQL dfini par lutilisateur (SQL Template)

Dans le champ Database Name, renseignez le nom de la base de donnes o se trouvent les tables sur lesquelles vous voulez travailler. Slectionnez la connexion MySQL approprie partir de la liste droulante Component list, dans le cas o vous utilisez plus dune connexion. Cliquez dans le champ Table name et appuyez sur Ctrl+Espace pour atteindre la liste gnrale des variables. A partir de cette liste de ((String)globalMap.get("tMysqlTableList_1_CURRENT_TABLE")). Comment crer votre propre modle SQL (SQL Template) : Dans la vue en arborescence du Repository, dveloppez successivement les nuds SQL Templates et MySQL. variables, slectionnez

Cliquez-droit sur le nud UserDefined et slectionnez loption Create SQLTemplate partir de la liste. Lassistant New SQLTemplate saffiche lcran.

Guide de Rfrence des Composants Talend Open Studio

703

Scnario : Effectuer une opration ditration sur des tables et en effacer le contenu grce un modle SQL dfini par lutilisateur (SQL Template)

Saisissez un nom pour le nouveau modle (SQL template) et remplissez les autres champs si ncessaire, puis cliquez sur Finish pour fermer lassistant. Lditeur de modle SQL saffiche dans lditeur graphique. Supprimez le code existant et saisissez le code permettant dexcuter laction voulue, cest--dire, ici, effacer le contenu de toutes les tables dont les noms commencent par ex.

Dans un code SQL template, il est impratif dutiliser le nom exact de la variable, en association avec le paramtre dsignant le nom de la table (__TABLE-NAME__ dans cet exemple). Pour afficher le nom de la variable utilise, positionnez votre curseur sur le champ Table Name de la vue Basic Settings du composant tELT.

Appuyez sur Ctrl+S pour sauvegarder le nouveau modle que vous venez de dfinir. La prochaine tape consiste ajouter ce nouveau modle SQL template la liste de modles du mme type dans le composant tELT. Comment ajouter votre propre modle SQL la liste de modles du mme type : Dans la vue Component du composant tELT, cliquez sur longlet SQL Templates pour afficher la liste de modles SQLTemplate List.

704

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Cliquez sur le bouton Add et ajoutez deux lignes de modles SQL template. Cliquez sur la premire ligne pour afficher un menu droulante puis cliquez sur la flche de ce menu pour drouler la liste des modles.

Dans la liste, slectionnez le modle SQL template que vous venez de crer. Assurez-vous que le modle de la seconde ligne est bien en mode Commit. Enregistrez le Job et appuyez sur F6 pour lexcuter. Toutes les tables de la base de donnes MySQL examples dont le nom commence par ex sont alors vides de leur contenu.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table

Guide de Rfrence des Composants Talend Open Studio

705

tNetezzaBulkExec

tNetezzaBulkExec

Proprits du tNetezzaBulkExec
Famille de composant Fonction Objectif Basic settings Databases/Netezza Le composant tNetezzaBulkExec effectue une action dInsert sur les donnes fournies. Le tNetezzaBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Netezza. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tNetion tezzaConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit exister pour que lopration dInsert soit autorise.

706

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant (Repository). Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Field Separator Require quotes around data files Row Separator Escape character Caractre, chane ou expression rgulire sparant les champs. () Cochez cette case pour utiliser des caractres pour entourer les donnes. Chane (ex : \n sous Unix) sparant les lignes. Caractre dchappement de la ligne.

Date format / Date deli- Date format: Utilisez ce champ pour reprsenter lordre miter des mois, des jours et des annes sous forme de chane de caractres. Date delimiter : Utilisez ce champ pour dfinir llment sparateur entre les valeurs. Time format/ Time deli- Time format : Utilisez ce champ pour reprsenter le formiter mat de lheure sous forme de chane de caractres. Time delimiter : Utilisez ce champ pour dfinir llment sparateur entre les valeurs. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Saisissez le nombre maximal derreurs possibles avant que le processus ne sarrte. Renseignez le nombre de lignes ignorer. Cochez cette case pour collecter les donnes de log au niveau du composant.

Max Errors Skip Rows tStatCatcher Statistics Utilisation Limitation

Ce composant est principalement utilis lorsque des transformations non particulires sont requises sur les donnes charger dans la base de donnes Netezza. n/a

Scnarios associs
Pour des scnarios associs au composant tNetezzaBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk.

Guide de Rfrence des Composants Talend Open Studio

707

Scnarios associs

la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

708

Guide de Rfrence des Composants Talend Open Studio

tNetezzaClose

tNetezzaClose

Proprits du tNetezzaClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Netezza Le composant tNetezzaClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Netezza. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tNetezzaConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tNetezzaConnection et tNetezzaRollback. Il est gnralement utilis avec un composant tNetezzaConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tNetezzaClose, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

709

tNetezzaCommit

tNetezzaCommit

Proprits du tNetezzaCommit
Ce composant est troitement li aux composants tNetezzaConnection et tNetezzaRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Netezza Le composant tNetezzaCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close Connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tNetezzaConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tNetezzaCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Netezza et notamment avec les composants tNetezzaConnection et tNetezzaRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tNetezzaConnection et tNetezzaRollback. Ils sont gnralement utiliss avec un composant tNetezzaConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tNetezzaCommit, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

710

Guide de Rfrence des Composants Talend Open Studio

tNetezzaConnection

tNetezzaConnection

Proprits du tNetezzaConnection
Ce composant est troitement li aux composants tNetezzaCommit et tNetezzaRollback. Ils sont gnralement utiliss avec un composant tNetezzaConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Netezza Le composant tNetezzaConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Table Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Additional JDBC Para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Utilisation Limitation Ce composant est gnralement utilis avec des composants Netezza, notamment les composants tNetezzaCommit et tNetezzaRollback. n/a

Scnario associ
Pour un scnario associ au composant tNetezzaConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

Guide de Rfrence des Composants Talend Open Studio

711

tNetezzaInput

tNetezzaInput

Proprits du tNetezzaInput
Famille de composant Fonction Objectif Databases/Netezza Le composant tNetezzaInput lit une base de donnes et en extrait des champs laide de requtes. Le tNetezzaInput excute une requte de base de donnes dans laquelle lordre doit strictement correspondre lordre dfini dans le schma. Puis la liste des champs est transmise au composant via une connexion Main row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionne le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez un composant tNetion tezzaConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio.

Basic settings

712

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Host Port Database

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type et Query Nom de la table de base de donnes. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cochez cette case et dfinissez le nombre de lignes avec lesquelles vous souhaitez travailler en une fois. Cette option permet doptimiser les performances.

Advanced settings

Use cursor

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Utilisation Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Netezza.

Scnarios associs
Consultez les scnarios du composant tNetezzaInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Pour un scnario associ, consultez la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

Guide de Rfrence des Composants Talend Open Studio

713

tNetezzaNzLoad

tNetezzaNzLoad
Ce composant invoque lutilitaire nzload de Netezza afin dinsrer des enregistrements dans une base de donnes Netezza. Ce composant peut tre utilis soit en mode standalone, il chargera alors les donnes partir dun fichier de donnes existant, soit connect un flux dentre, afin de charger des donnes partir du composant connect.

Proprits du tNetezzaNzLoad
Famille de composant Fonction Objectif Basic settings Databases/Netezza Le composant tNetezzaNzLoad insre des donnes dans la table dune base de donnes Netezza via lutilitaire nzload de Netezza. Ce composant permet de charger en masse des donnes dans une table Netezza soit partir dun fichier, soit partir dun flux dentre, soit partir dun tube nomm. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table dans laquelle les donnes doivent tre insres. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio.

714

Guide de Rfrence des Composants Talend Open Studio

Proprits du tNetezzaNzLoad

Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Data file Chemin daccs complet au fichier de donnes utiliser. Si ce composant est utilis seul (non connect un autre composant par un flux dentre), alors saisissez le nom dun fichier existant charger dans la base de donnes. Sil est connect un autre composant par un flux dentre, saisissez le nom du fichier gnrer et crire avec les donnes dentre, afin de lutiliser plus tard avec nzload pour charger dans la base de donnes. Cochez cette case afin dutiliser un tube nomm la place dun fichier de donnes. Cette option ne peut tre utilise que lorsque le composant est connect un autre composant par un flux dentre. Quand la case est coche, aucun fichier de donnes nest gnr, et les donnes sont transfres lutilitaire nzload via un tube nomm. Cette option amliore grandement les performances sous Linux et Windows. Ce composant, en mode tube nomm, utilise une interface JNI pour crer un tube nomm et crire dedans, dans toute plateforme Windows. Le chemin daccs associ au fichier DLL JNI doit tre configur dans le chemin daccs la bibliothque Java. Le composant est automatiquement fourni dans le Studio avec deux DLL pour les systmes dexploitation de 32 et 64 bits. Named-pipe name Advanced settings Spcifiez un nom pour le tube nomm utiliser. Vrifiez que le nom saisi est valide.

Use named-pipe

Use existing control file Cochez cette case pour fournir un fichier de contrle utiliser avec lutilitaire nzload au lieu de spcifier explicitement toutes les options dans le composant. Lorsque cette case est coche, loption Data file ainsi que les autres options lies au nzload ne sappliquent plus. Veuillez vous rfrer au manuel du nzload de Netezza pour plus dinformations concernant la cration dun fichier de contrle. Control file Saisissez le chemin daccs au fichier de contrle utiliser, entre guillemets doubles, ou cliquez sur le bouton [...] afin de parcourir votre rpertoire jusquau fichier de contrle. Cette option est passe lutilitaire nzload via largument -cf. Caractre, chane de caractres ou expression rgulire utilis pour sparer les champs. Argument delim de lutilitaire nzload. Si vous nutilisez pas loption Wrap quotes around fields , vous devez tre sr que le dlimiteur nest pas inclus dans les donnes insres dans la base de donnes. La valeur par dfaut est \t ou TAB .. Pour amliorer les performances, utilisez la valeur par dfaut. Wrap quotes around Cette option ne sapplique quaux colonnes de type String, fields Byte, Byte[], Char, et Object. Slectionnez soit :

Field separator

Guide de Rfrence des Composants Talend Open Studio

715

Proprits du tNetezzaNzLoad

None : nentourez pas les valeurs des colonnes de guillemets. Single quote : entourez les valeurs des colonnes de guillemets simples. Double quote : entourez les valeurs des colonnes de guillemets doubles. Si vous utilisez loption Single quote ou Double quote , il est ncessaire dutiliser \ en tant que Escape char. Advanced options Dfinissez les arguments nzload dans le tableau correspondant. Cliquez sur le bouton [+] autant de fois que ncessaire afin dajouter les arguments au tableau. Cliquez sur le champ Parameter et choisissez largument souhait dans la liste, puis cliquez sur le champ Value correspondant et saisissez une valeur entre guillemets. Parameter -If Nom du fichier de log gnrer. Les logs seront ajouts la suite du fichier de log, sil existe dj. Si le paramtre nest pas spcifi, le nom par dfaut du fichier de log est '<table_name>.<db_name>.nzlog'. Il est gnr dans le rpertoire de travail courant dans lequel le Job est excut. Nom du fichier de mauvais enregistrements gnrer. Le fichier de mauvais enregistrements contient tous les enregistrements ne pouvant tre chargs, cause dune erreur interne Netezza. Les enregistrements seront ajouts la suite si le fichier de mauvais enregistrements existe dj. Si le paramtre nest pas spcifi, le nom par dfaut du fichier de mauvais enregistrements est '<table_name>.<db_name>.nzbad'. Il est gnr dans le rpertoire de travail courant, dans lequel le Job est excut. Chemin daccs au rpertoire dans lequel les fichiers de log et de mauvais enregistrements sont gnrs. Si le paramtre nest pas spcifi, les fichiers seront gnrs sous le rpertoire courant dans lequel le Job est excut. Taille maximale du fichier de log. La valeur est en MB. La valeur par dfaut est de 2000 ou 2GB. Pour conomiser de lespace disque, spcifiez un petite valeur si votre Job est souvent excut. Slectionnez cette option si le fichier de donnes est compresse. Les valeurs valides sont "TRUE" et "FALSE". La valeur par dfaut est "FALSE". Cette option nest valide que si ce composant est utilis par lui-mme et non connect un autre composant via un flux dentre. -skipRows <n> Nombre de lignes ignorer au dbut du fichier de donnes. Paramtrez la valeur "1" si vous souhaitez ignorer la ligne den-tte du fichier dentre. La valeur par dfaut est "0".

-bf

-ouputDir

-logFileSize

-compress

716

Guide de Rfrence des Composants Talend Open Studio

Proprits du tNetezzaNzLoad

Cette option ne doit tre slectionne que si le composant est utilis par lui-mme et non connect un autre composant via un flux dentre. -maxRows <n> Nombre de lignes charger partir du fichier dentre. Cette option ne doit tre slectionne que si le composant est utilis par lui-mme et non connect un autre composant via un flux dentre. -maxErrors Nombre maximal denregistrements derreurs autoriser avant de terminer le processus de chargement. La valeur par dfaut est "1". Les zros contenus dans une source binaire gnreront des erreurs. Paramtrez cette option "NO" pour gnrer des erreurs ou "YES" pour ignorer les bits ayant la valeur zro. La valeur par dfaut est "NO". Cette option ncessite que toutes les valeurs soient entoures de guillemets. La valeur par dfaut est "FALSE". Cette option ne fonctionne pas avec un flux dentre pour le moment. Utilisez cette option uniquement en mode standalone avec un fichier existant. -nullValue <token> Spcifiez le jeton pour indiquer une valeur null dans le fichier de donnes. La valeur par dfaut est "NULL". Afin damliorer lgrement les performances, vous pouvez configurer cette valeur comme un champ vide en spcifiant la valeur : "\'\'". Traite les derniers champs dentre manquants comme des null. Vous navez pas besoin de spcifier de valeur pour cette option dans le champ du tableau. Cette option nest pas active par dfaut, les champs dentre devront donc correspondre exactement toutes les colonnes de la table par dfaut. Les derniers champs dentre doivent tre nullables dans la base de donnes. -ctrlChar Accepte les caractres de contrle dans les champs char/ varchar (vous devrez chapper les caractres NUL, CR et LF). Vous navez pas besoin de spcifier de valeur pour cette option dans le champ de valeur du tableau. Cette option est dsactive par dfaut. Accepte le caractre CR non chapp dans des champs char/varchar (LF devient une fin de ligne). Vous navez pas besoin de spcifier de valeur pour cette option dans le champ de valeur du tableau. Cette option est dsactive par dfaut. Tronque toute valeur de chane de caractres qui dpasse sa valeur dclare de stockage char/varchar. Vous navez pas besoin de spcifier de valeur pour cette option dans le champ de valeur du tableau. Cette option est dsactive par dfaut.

-ignoreZero

-requireQuotes

-fillRecord

-ctInString

-truncString

Guide de Rfrence des Composants Talend Open Studio

717

Proprits du tNetezzaNzLoad

-dateStyle

Spcifiez le format de la date des donnes dentre. Les valeurs valides sont : "YMD", "Y2MD", "DMY", "DMY2", "MDY", "MDY2", "MONDY", "MONDY2". La valeur par dfaut est "YMD". Le format de date dans la colonne du schma du composant doit correspondre la valeur spcifie ici. Par exemple, si vous souhaitez charger une colonne DATE, spcifiez ainsi le format de date dans le schma du composant : "yyyy-MM-dd" et paramtrez loption -dateStyle "YMD". Pour une description plus prcise du chargement de champs de dates et de temps, consultez la section intitule Charger des colonnes de type DATE, TIME et TIMESTAMP .

-dateDelim

Caractre dlimiteur entre les parties dune date. La valeur par dfaut est "-" pour tous les styles de date, sauf pour "MONDY[2]" pour lequel elle est " " (espace vide). Le format de date dans la colonne du schma du composant doit correspondre la valeur spcifie ici.

-y2Base -timeStyle

Premire anne exprimable via lutilisation du style de date deux chiffres (Y2). Spcifiez le format du temps dans les donnes dentre. Les valeurs valides sont : "24HOUR" et "12HOUR". La valeur par dfaut est "24HOUR". Pour amliorer lgrement les performances, gardez la valeur par dfaut. Le format de temps dans la colonne du schma du composant doit correspondre la valeur spcifie ici. Par exemple, si vous souhaitez charger une colonne de type TIME, configurez le format de date dans le schma du composant "HH:mm:ss" et loption -timeStyle "24HOUR". Pour une description plus prcise du chargement de champs de dates et de temps, consultez la section intitule Charger des colonnes de type DATE, TIME et TIMESTAMP .

-timeDelim

Caractre dlimiteur entre les parties dune donne de temps. La valeur par dfaut est ":". Le format de temps dans la colonne du schma du composant doit correspondre la valeur spcifie ici.

-timeRoundNanos -boolStyle

Autorise mais arrondit les nombres diffrents de zro plus petits quune microseconde. Spcifiez le format dans lequel les donnes de type Boolean sont crites dans les donnes. Les valeurs valides sont : "1_0", "T_F", "Y_N", "TRUE_FALSE", "YES". La valeur par dfaut est "1_0". Pour amliorer lgrement les performances, gardez la valeur par dfaut.

718

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

-allowRelay

Permet de continuer le chargement malgr une ou plusieurs rinitialisation(s) ou chec(s) des SPU (Snippet Processing Unit). Par dfaut, ce comportement nest pas autoris. Spcifiez le nombre de continuations du chargement autoris. La valeur par dfaut est "1". Slectionnez lencodage partir de la liste. Cochez cette case afin de spcifier le chemin daccs complet lexcutable nzload. Vous devez cocher cette case si le chemin daccs nest pas spcifi dans la variable denvironnement PATH.

-allowRelay <n> Encoding Specify nzload path

Full path to nzload exe- Chemin daccs complet lexcutable nzload sur la macutable chine en cours dutilisation. Il est recommand de spcifier le chemin daccs dans la variable denvironnement PATH au lieu de slectionner cette option. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est principalement utilis lorsque des transformations particulires ne sont pas requises sur les donnes charger dans la base de donnes. Ce composant peut tre utilis en standalone ou en tant que composant de sortie.

Charger des colonnes de type DATE, TIME et TIMESTAMP


Lorsque ce composant est utilis avec un flux dentre, le format de date spcifi dans le schma du composant doit correspondre la valeur spcifie pour les options -dateStyle, -dateDelim, -timeStyle, et -timeDelim. Veuillez vous rfrer aux exemples suivants : Type de donnes DATE TIME TIMESTAMP Format de date dans le sch- -dateStyle ma "yyyy-MM-dd" "HH:mm:ss" "yyyy-MM-dd HH:mm:ss" "YMD" n/a "YMD" -dateDelim "-" n/a "-" -timeStyle n/a "24HOUR" "24HOUR" -timeDelim n/a ":" ":"

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Insrer des donnes dans une base MySQL Scnario : Insrer des donnes dans une base MySQL du composant tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

719

tNetezzaOutput

tNetezzaOutput

Proprits du tNetezzaOutput
Famille de composant Fonction Objectif Basic settings Databases/Netezza Le composant tNetezzaOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tNetezzaOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez un composant tNetion tezzaConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Adresse IP du serveur de base de donnes.

720

Guide de Rfrence des Composants Talend Open Studio

Proprits du tNetezzaOutput

Port Database

Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : Default : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondant au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete. Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Guide de Rfrence des Composants Talend Open Studio

721

Proprits du tNetezzaOutput

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Extend Insert Cochez cette case pour insrer un ensemble de lignes dfinies au lieu dinsrer les lignes une par une. Cette option permet un important gain de performance. Number of rows per insert: : saisissez le nombre de lignes insrer en un bloc. Notez que si vous slectionnez un nombre important de lignes, cela peut augmenter la quantit de mmoire utilise et donc diminuer les performances. Use Batch size Cochez cette case afin dactiver le mode batch pour le traitement des donnes. Dans le champ Batch Size qui apparat, vous pouvez saisir le nombre de lignes par lot charger. Cette case est disponible uniquement si vous avez choisi loption Insert, Update, Single Insert Query ou Delete dans le champ Action on data. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer.

Additional Columns

722

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tNetezzaOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Netezza. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au composant tNetezzaOutput, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

723

tNetezzaRollback

tNetezzaRollback

Proprits du tNetezzaRollback
Ce composant est troitement li aux composants tNetezzaCommit et tNetezzaConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/Netezza Le tNetezzaRollback annule la transaction dans une base de donnes connecte. Ce composant permet dviter le commit de transaction involontaire. Component list Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tNetezzaConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce component est gnralement utilis avec dautres composants Netezza, notamment les composants tNetezzaConnection et tNetezzaCommit. n/a

Scnario associ
Pour un scnario associ au composant tNetezzaRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

724

Guide de Rfrence des Composants Talend Open Studio

tNetezzaRow

tNetezzaRow

Proprits du tNetezzaRow
Famille de composant Fonction Databases/Netezza tNetezzaRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tNetezzaRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tNetion tezzaConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Objectif

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

725

Proprits du tNetezzaRow

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution.

726

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnario associ
Pour un scnario associ au composant tNetezzaRow, consultez la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL .

Guide de Rfrence des Composants Talend Open Studio

727

tOracleBulkExec

tOracleBulkExec

Proprits du tOracleBulkExec
Les composants tOracleOutputBulk et tOracleBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tOracleOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Oracle Le composant tOracleBulkExec insre, ajoute, remplace ou supprime les donnes dune base de donnes Oracle. Le tOracleBulkExec est un composant ddi, il permet un gain de performance lors du traitement des donnes de la base de donnes Oracle. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez un composant tOtion racleConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Connection type DB Version Host Liste droulante contenant les pilotes disponibles Slectionnez la version dOracle que vous utilisez Adresse IP du serveur de base de donnes

728

Guide de Rfrence des Composants Talend Open Studio

Proprits du tOracleBulkExec

Port Database Schema

Numro du port dcoute du serveur de base de donnes Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crire. Notez quune seule table peut tre crite la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Data file name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Insrer des lignes dans une table vide. Le Job sarrte en cas de doublons. Update : Mettre jour les entres existantes. Append : Ajouter des lignes aux donnes dj existantes. Replace : Ecraser des lignes de la table. Truncate : Supprimer les entres correspondant au flux dentre. Il est ncessaire de spcifier au minimum une cl de recherche sur laquelle baser les oprations dUpdate. Il est possible de dfinir les colonnes qui agiront comme cl de recherche partir du schma, pour une utilisation de base, ou partir des options avances (Advanced settings) pour une utilisation optimise de ces oprations. Schema et Edit schema Dans une procdure stocke, le schma est un paramtre dentre. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository.

Guide de Rfrence des Composants Talend Open Studio

729

Proprits du tOracleBulkExec

Advanced settings

Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss numbers) pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Use existing control file Cochez cette case si vous utilisez un fichier de contrle (.ctl) et spcifiez son chemin daccs dans le champ .ctl file name. Record format Dfinissez le format de lenregistrement : Default : les paramtres du format sont dfinis par dfaut. Stream : dterminez le sparateur de fin denregistrement. Fixed : dterminez la longueur denregistrement. Variable : dterminez la taille du champ spcifiant la longueur de lenregistrement. Specify .ctl files INTO Cochez cette case pour renseigner manuellement la clause TABLE clause manually INTO TABLE du fichier de contrle, directement dans le code. Fields terminated by Caractre, chane ou expression rgulire sparant les champs : None : aucun caractre de sparation. Whitespace : le caractre de sparation est un espace. EOF (used for loading LOBs from lobfile) : la sparation est constitue dun caractre de fin de fichier (End Of File). Other terminator : la sparation est constitue dun caractre autre que ceux prcdemment noncs. Use fields enclosure Cochez cette case si vous voulez utiliser des caractres pour entourer le texte : Fields enclosure (left part) : caractre dlimitant les champs sur la gauche. Field enclosure (right part) : caractre dlimitant les champs sur la droite. Use schemas Date Pat- Cochez cette case pour utiliser le modle de date contenu tern to load Date field dans le schma pour remplir le champ concernant la date. Specify field condition Preserve blanks Trailing null columns Load options Cochez cette case pour dfinir une condition de chargement des donnes. Cochez cette case pour conserver les espaces vides. Cochez cette case pour charger des donnes avec des colonnes vides. Cliquez sur le bouton [+] afin dajouter des options de chargement des donnes : Parameter : choisissez lun des paramtres de chargement partir de la liste droulante.

730

Guide de Rfrence des Composants Talend Open Studio

Scnario : Supprimer et insrer des donnes dans une base Oracle

Value : dfinissez la valeur attribuer au paramtre. NLS Language A partir de la liste droulante, dfinissez la langue utilise pour les donnes qui ne sont pas codes en Unicode.

Set Parameter Cochez cette case pour modifier les conventions NLS_TERRITORY d'appellation utilises pour la numrotation des jours et des semaines. La valeur par dfaut est celle du systme d'exploitation. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Slectionnez la sortie utiliser pour rcuprer la sortie standard de la base Oracle : to console : vers la console. to global variable : vers la variable globale. Convert columns and Cochez cette case pour mettre le nom des colonnes et celui table names to upper- de la table en majuscules. case tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Output

Ce composant ddi offre performance et flexibilit lors de requtes sur les bases de donnes Oracle.

Scnario : Supprimer et insrer des donnes dans une base Oracle


Ce scnario dcrit comment supprimer le contenu dune base de donnes Oracle et dinsrer de nouvelles donnes partir du contenu dun fichier dentre. Le Job est constitu de trois composants qui crent le contenu, le transfert dans un fichier qui sera ensuite charg dans la base Oracle aprs que les donnes de la table aient t supprimes.

Cliquez et dposez les composants suivants : tOracleInput, tFileOutputDelimited, tOracleBulkExec. Connectez le composant tOracleInput au tFileOutputDelimited laide dun lien Row main. Et connectez le tOracleInput au tOracleBulkExec laide dun lien OnSubjobOk. Paramtrez les informations de connexion la base de donnes Oracle. Nous vous conseillons de stocker ces informations dans une mtadonne du Repository pour pouvoir les rutiliser par la suite dans tous vos Job.

Guide de Rfrence des Composants Talend Open Studio

731

Scnario : Supprimer et insrer des donnes dans une base Oracle

Paramtrez le schma, sil nest pas conserv dans le Repository. Dans cet exemple, le schma est comme suit : ID_Contract, ID_Client, Contract_type, Contract_Value. Dans le champ Encoding, slectionnez loption Custom et dfinissez AL32UTF8 comme encodage. Dans le champ Basic settings du composant tFileOutputDelimited, paramtrez ses proprits, notamment les champs File Name, Row separator et Fields separator avec respectivement le chemin daccs et le nom du fichier, le sparateur de lignes et de champs. Dans le champ Encoding, saisissez le mme encodage que celui saisi dans les proprits du composant tOracleInput. Double-cliquez ensuite sur le composant tOracleBulkExec pour dfinir les proprits dalimentation de la base de donnes.

Dans le champ Property Type, slectionnez le mode Repository si vous avez stock les informations de connexion la base de donnes sous le nud Metadata du Repository ou slectionnez le mode Built-In pour les dfinir manuellement. Dans ce scnario, utilisez le mode Built-In. Dfinissez si ncessaire les paramtres de connexion dans les champs Host, Port, Database, Schema, Username et Password.

732

Guide de Rfrence des Composants Talend Open Studio

Scnario : Supprimer et insrer des donnes dans une base Oracle

Dans le champ Table, renseignez le nom de la Table alimenter et dans le champ Action on data, slectionnez laction effectuer, ici : Insert Dans le champ Schema, slectionnez le mode Built in puis cliquez sur le bouton [...] ct du champ Edit Schema pour dfinir les donnes passer au composant suivant. Cliquez sur la vue Advanced settings pour configurer les paramtres avancs du composant.

Cochez la case Use an existing control file si vous avez stock les informations relatives ltat de la base de donnes dans un fichier de contrle (.ctl). Sinon, renseignez si ncessaire les champs suivants manuellement : Record format, Specify .ctl files INTO TABLE clause manually, Field terminated by, Use field enclosure, Use schemas Date Pattern to load Date field, Specify field condition, Preserve blanks, Trailing null columns, Load options, NLS Language et Set Parameter NLS_TERRITORY en fonction de votre base de donnes. Dans le champ Encoding Type, paramtrez lencodage comme dans les tapes prcdentes. Et dans le champ Output, slectionnez loption to console, ainsi la sortie standard de la base sera affiche dans la console. Appuyez sur F6 pour excuter le Job. La sortie de log apparat dans la vue Run et la table est alimente par les donnes du fichier paramtr. Voir galement : la section intitule Scnario : Insrer des donnes dans une base MySQL Scnario : Insrer des donnes dans une base MySQL, page 709

Guide de Rfrence des Composants Talend Open Studio

733

tOracleClose

tOracleClose

Proprits du tOracleClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Oracle Le composant tOracleClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Oracle. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tOracleConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec d'autres composants Oracle, notamment tOracleConnection et tOracleCommit. n/a

Scnario associ
Ce composant est troitement li aux composants tOracleConnection et tOracleRollback. Il est gnralement utilis avec un composant tOracleConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tOracleClose, consultez la section intitule tMysqlConnection

734

Guide de Rfrence des Composants Talend Open Studio

tOracleCommit

tOracleCommit

Proprits du tOracleCommit
Ce composant est troitement li aux composants tOracleCommit et tOracleRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Oracle Le composant tOracleCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tOracleConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tOracleCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Oracle et notamment tOracleConnection et tOracleRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tOracleConnection et tOracleRollback. Ils sont gnralement utiliss avec un composant tOracleConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tOracleCommit, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

735

tOracleConnection

tOracleConnection

Proprits du tOracleConnection
Ce composant est troitement li aux composants tOracleCommit et tOracleRollback. Ils sont gnralement utiliss avec un composant tOracleConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Oracle Le composant tOracleConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Connection type Liste droulante des pilotes disponibles: Oracle OCI : Slectionnez ce type de connexion pour utiliser linterface dappel de la base de donnes Oracle ( Oracle Call Interface) accompagne dun ensemble de logiciels API de langage C qui fournissent une interface cette base de donnes Oracle. Oracle RAC : Slectionnez ce type de connexion pour accder une base de donnes contenant des clusters. Oracle Service Name : Slectionnez ce type de connexion pour utiliser lalias TNS que vous fournissez lorsque vous vous connectez la base de donnes distante. WALLET : Slectionnez ce type de connexion pour stocker les informations didentification dans un portefeuille Oracle (Oracle wallet). Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur un systme. DB Version Use tns file Slectionnez la version dOracle que vous utilisez. Cochez cette case pour utiliser les mtadonnes dun contexte contenu dans un fichier tns. Un mme fichier Tns peut contenir plusieurs contextes. TNS File : Renseignez manuellement le chemin daccs ou cliquez sur le bouton [...] pour parcourir vos dossiers jusquau fichier Tns utiliser.

736

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Select a DB Connection in Tns File : Cliquez sur le bouton [...] pour afficher tous les contextes du fichier Tns et slectionner celui utiliser. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma

Username et Password Informations dauthentification de lutilisateur de base de donnes. Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Dans ce champ, vous pouvez paramtrer le type dencodage. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Utilisation Limitation Ce composant est gnralement utilis avec des composants Oracle, notamment les composants tOracleCommit et tOracleRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tOracleCommit et tOracleRollback. Ils sont gnralement utiliss avec un composant tOracleConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tOracleConnection, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

737

tOracleInput

tOracleInput

Proprits du tOracleInput
Famille de composant Fonction Objectif Databases/Oracle Le composant tOracleInput lit une base de donnes et en extrait des champs laide de requtes. Le tOracleInput excute une requte de base de donnes dans laquelle lordre doit strictement correspondre lordre dfini dans le schma. Puis la liste des champs est transmise au composant via une connexion Main Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionne le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez un composant tOtion racleConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio.

Basic settings

738

Guide de Rfrence des Composants Talend Open Studio

Proprits du tOracleInput

Connection type

Liste droulante des pilotes disponibles: Oracle OCI : Slectionnez ce type de connexion pour utiliser linterface dappel de la base de donnes Oracle ( Oracle Call Interface) accompagne dun ensemble de logiciels API de langage C qui fournissent une interface cette base de donnes Oracle. Oracle RAC : Slectionnez ce type de connexion pour accder une base de donnes contenant des clusters. Oracle Service Name : Slectionnez ce type de connexion pour utiliser lalias TNS que vous fournissez lorsque vous vous connectez la base de donnes distante. WALLET : Slectionnez ce type de connexion pour stocker les informations didentification dans un portefeuille Oracle (Oracle wallet). Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur un systme.

DB Version Host Port Database Oracle schema

Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma Oracle.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type et Query Nom de la table de base de donnes. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cochez cette case pour collecter les donnes de log au niveau du composant. Cochez cette case et dfinissez le nombre de lignes avec lesquelles vous souhaitez travailler en une fois. Cette option permet doptimiser les performances.

Advanced settings

tStatCatcher Statistics Use cursor

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres.

Guide de Rfrence des Composants Talend Open Studio

739

Scnarios associs

Trim column No null values Utilisation

Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour optimiser les performances s'il n'y a pas de valeur nulle.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Oracle.

Scnarios associs
Consultez les scnarios du composant tOracleInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Pour un scnario associ, consultez la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

740

Guide de Rfrence des Composants Talend Open Studio

tOracleOutput

tOracleOutput

Proprits du tOracleOutput
Famille de composant Fonction Objectif Basic settings Databases/Oracle Le composant tOracleOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tOracleOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tOtion racleConnection. Lorsque vous la dcochez, une case (coche par dfaut, suivie dun champ) apparat dans les Advanced settings, Batch Size, qui vous permet de saisir le nombre de lignes dans chaque lot de traitement de donnes. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs.

Guide de Rfrence des Composants Talend Open Studio

741

Proprits du tOracleOutput

Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Connection type Liste droulante des pilotes disponibles: Oracle OCI : Slectionnez ce type de connexion pour utiliser linterface dappel de la base de donnes Oracle ( Oracle Call Interface) accompagne dun ensemble de logiciels API de langage C qui fournissent une interface cette base de donnes Oracle. Oracle RAC : Slectionnez ce type de connexion pour accder une base de donnes contenant des clusters. Oracle Service Name : Slectionnez ce type de connexion pour utiliser lalias TNS que vous fournissez lorsque vous vous connectez la base de donnes distante. WALLET : Slectionnez ce type de connexion pour stocker les informations didentification dans un portefeuille Oracle (Oracle wallet). Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur un systme. DB Version Host Port Database Username et Password Table Action on table Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Informations dauthentification de lutilisateur de la base de donnes. Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : Default : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes.

742

Guide de Rfrence des Composants Talend Open Studio

Proprits du tOracleOutput

Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondant au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Override any existing Cochez cette case pour craser les NLS_LANG environment d'environnement NLS_LANG dj dfinies. variable Commit every variables

Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la quali-

Guide de Rfrence des Composants Talend Open Studio

743

Scnarios associs

t de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. tStatCatcher Statistics Additional Columns Cochez cette case pour collecter les donnes de log au niveau du composant. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tOracleOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Use Hint Options Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour ajouter des indicateurs (ou Hints) permettant doptimiser le plan dexcution de la requte afin dobtenir les meilleurs performances possibles.

Convert columns and Cochez cette case pour passer les noms de colonnes et de table to uppercase tables en majuscule. Enable debug mode Use Batch Size Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Nombre de lignes dans chaque lot de traitement de donnes. Si cette case napparat pas, vrifiez que la case Use an existing connection dans les Basic settings est dcoche. Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement lors dune instruction WHERE. Utilisation Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Ce composant doit tre utilis en tant que composant de sortie. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Oracle. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au composant tOracleOutput, consultez :

744

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

745

tOracleOutputBulk

tOracleOutputBulk

Proprits du tOracleOutputBulk
Les composants tOracleOutputBulk et tOracleBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tOracleOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Oracle Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards Oracle. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes Oracle. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Create directory if not Cette option permet de crer le dossier contenant le fiexists chier de sortie sil nexiste pas dj. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Advanced separator Cochez cette option pour modifier les sparateurs utili(for numbers) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux.

746

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Field separator Row separator Encoding Type

Caractre, chane ou expression rgulire sparant les champs. Chane (ex : \n sous Unix) sparant les lignes. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Configurez les paramtres Buffer Size et StringBuilder Size afin d'optimiser les performances selon la mmoire. Cochez cette case pour collecter les donnes de log au niveau du composant.

Bulk file parameters

tStatCatcher Statistics Utilisation

Ce composant est gnralement utilis avec le composant tOracleBulkExec. Ensemble ils offrent un gain de performance important pour lalimentation dune base de donnes Oracle.

Scnarios associs
Pour des scnarios associs au composant tOracleOutputBulk, consultez les scnarios suivants : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

747

tOracleOutputBulkExec

tOracleOutputBulkExec

Proprits du tOracleOutputBulkExec
Les composants tOracleOutputBulk et tOracleBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tOracleOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/Oracle Le tOracleOutputBulkExec effectue une action dInsert sur les donnes fournies. Ce composant est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Oracle. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tOtion racleConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Connection type DB Version Host Port Liste droulante des pilotes disponibles. Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes.

748

Guide de Rfrence des Composants Talend Open Studio

Proprits du tOracleOutputBulkExec

Database Schema

Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer un rpertoire o stocker la table de sortie si elle nexiste pas. Append Action on data Cochez cette case afin dajouter de nouvelles lignes la fin de lenregistrement. Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Truncate : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une cl de recherche sur laquelle baser les oprations dUpdate. Il est possible de dfinir les colonnes qui agiront comme cl de recherche partir du schma, pour une utilisation de base, ou partir des options avances (Advanced settings) pour une utilisation optimise de ces oprations.

Action on table

Guide de Rfrence des Composants Talend Open Studio

749

Proprits du tOracleOutputBulkExec

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss numbers) pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Use existing control file Cochez cette case si vous utilisez un fichier de contrle (.ctl). Record format Dfinissez le format de lenregistrement : Default : les paramtres du format sont dfinis par dfaut. Stream : dterminez le sparateur de fin denregistrement. Fixed : dterminez la longueur denregistrement. Variable : dterminez la taille du champ spcifiant la longueur de lenregistrement. Specify .ctl files INTO Cochez cette case pour renseigner manuellement la clause TABLE clause manually INTO TABLE du fichier de contrle, directement dans le code. Fields terminated by Caractre, chane ou expression rgulire sparant les champs : None : aucun caractre de sparation. Whitespace : le caractre de sparation est un espace. EOF (used for loading LOBs from lobfile) : la sparation est constitue dun caractre de fin de fichier (End Of File). Other terminator : la sparation est constitue dun caractre autre que ceux prcdemment noncs. Use fields enclosure Cochez cette case si vous voulez utiliser des caractres pour entourer le texte : Fields enclosure (left part) : caractre dlimitant les champs sur la gauche. Field enclosure (right part) : caractre dlimitant les champs sur la droite. Use schemas Date Pat- Cochez cette case pour utiliser le modle de date contenu tern to load Date field dans le schma pour remplir le champ concernant la date.

750

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Specify field condition Preserve blanks Trailing null columns Load options

Cochez cette case pour dfinir une condition de chargement des donnes. Cochez cette case pour conserver les espaces vides. Cochez cette case pour charger des donnes avec des colonnes vides. Cliquez sur le bouton [+] afin dajouter des options de chargement des donnes : Parameter : choisissez lun des paramtres de chargement partir de la liste droulante. Value : dfinissez la valeur attribuer au paramtre.

NLS Language

A partir de la liste droulante, dfinissez la langue utilise pour les donnes qui ne sont pas codes en Unicode.

Set Parameter Cochez cette case pour modifier les conventions NLS_TERRITORY d'appellation utilises pour la numrotation des jours et des semaines. La valeur par dfaut est celle du systme d'exploitation. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

Set Oracle Encoding Cochez cette case afin de saisir l'ensemble de caractres Type ct du champ Oracle Encoding Type. Output Slectionnez dans la liste droulante lendroit o rediriger le flux de sortie : to console : ver la console de log. to global variable : vers une variable globale. Convert columns and Cochez cette case pour mettre le nom des colonnes et celui table names to upper- de la table en majuscules. case Bulk file parameters tStatCatcher Statistics Utilisation Limitation Configurez les paramtres Buffer Size et StringBuilder Size afin d'optimiser les performances selon la mmoire. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

Scnarios associs
Pour des scnarios associs au composant tOracleOutputBulkExec, consultez les scnarios suivants : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

751

Scnarios associs

752

Guide de Rfrence des Composants Talend Open Studio

tOracleRollback

tOracleRollback

Proprits du tOracleRollback
Ce composant est troitement li aux composants tOracleCommit et tOracleConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases Le tOracleRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tOracleConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants Oracle, notamment les composants tOracleConnection et tOracleCommit. n/a

Scnario associ
Ce composant est troitement li aux composants tOracleConnection et tOracleCommit. Ils sont gnralement utiliss ensemble lors dune transaction. Pour un scnario associ au composant tOracleRollback, consultez la section intitule tMysqlRollback .

Guide de Rfrence des Composants Talend Open Studio

753

tOracleRow

tOracleRow

Proprits du tOracleRow
Famille de composant Fonction Databases/Oracle Le tOracleRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tOracleRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tOtion racleConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Connection type Liste droulante des pilotes disponibles: Oracle OCI : Slectionnez ce type de connexion pour utiliser linterface dappel de la base de donnes Oracle ( Oracle Call Interface) accompagne dun ensemble de

Objectif

Basic settings

754

Guide de Rfrence des Composants Talend Open Studio

Proprits du tOracleRow

logiciels API de langage C qui fournissent une interface cette base de donnes Oracle. Oracle RAC : Slectionnez ce type de connexion pour accder une base de donnes contenant des clusters. Oracle Service Name : Slectionnez ce type de connexion pour utiliser lalias TNS que vous fournissez lorsque vous vous connectez la base de donnes distante. Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur un systme. DB Version Host Port Database Schema Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma Oracle.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type Nom de la table de base de donnes. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column.

Guide de Rfrence des Composants Talend Open Studio

755

Scnario associ

Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnario associ
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du tMySQLRow.

756

Guide de Rfrence des Composants Talend Open Studio

tOracleSCD

tOracleSCD

Le composant tOracleSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tOracleSCD .

Guide de Rfrence des Composants Talend Open Studio

757

tOracleSCDELT

tOracleSCDELT

Le composant tOracleSCDELT appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tOracleSCDELT .

758

Guide de Rfrence des Composants Talend Open Studio

tOracleSP

tOracleSP

Proprits du tOracleSP
Famille de composant Fonction Objectif Basic settings Databases/Oracle Le composant tOracleSP appelle une procdure stocke de base de donnes. Ce composant permet de centraliser des requtes multiples ou complexes dans une base de donnes et de les appeler plus facilement. Use an existing connec- Cochez cette case et slectionnez le composant tOracletion Connection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Connection type Liste droulante des pilotes disponibles: Oracle OCI : Slectionnez ce type de connexion pour utiliser linterface dappel de la base de donnes Oracle ( Oracle Call Interface) accompagne dun ensemble de logiciels API de langage C qui fournissent une interface cette base de donnes Oracle. Oracle RAC : Slectionnez ce type de connexion pour accder une base de donnes contenant des clusters. Oracle Service Name : Slectionnez ce type de connexion pour utiliser lalias TNS que vous fournissez lorsque vous vous connectez la base de donnes distante.

Guide de Rfrence des Composants Talend Open Studio

759

Proprits du tOracleSP

Oracle SID : Slectionnez ce type de connexion pour identifier exclusivement une base de donnes spcifique sur un systme. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier des proprits du composant. Les champs suivants sont alors pr-remplis. DB Version Host Port Database Schema Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification sur lutilisateur de base de donnes. Schema et Edit schema Dans une procdure stocke, le schma est un paramtre dentre. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il est rutilisable. Voir galement le Guide utilisateur de Talend Open Studio. SP Name Saisissez le nom exact de la Procdure Stocke (SP). Is Function / Return re- Cochez cette case, si une seule valeur doit tre retourne. sult in Slectionnez dans la liste la colonne du schma sur laquelle est base la valeur obtenir. Parameters Cliquez sur le bouton [+] et slectionnez dans le champ Schema Columns les diffrentes colonnes ncessaires la procdure. Notez que le schma de la SP peut contenir plus de colonnes quil ny a de paramtres utiliss dans la procdure. Slectionnez le Type de paramtre : IN : paramtre dentre (Input) OUT : paramtre de sortie (Output)/valeur retourne IN OUT : les paramtres dentre doivent tre retournes sous forme de valeur, mme aprs modifications via la procdure (fonction). RECORDSET : les paramtres dentre doivent tre retournes sous forme densemble de valeurs, au lieu dune valeur unique. Consultez la section intitule tPostgresPlusClose si vous voulez analyser un ensemble

760

Guide de Rfrence des Composants Talend Open Studio

Proprits du tOracleSP

denregistrements dune table de donnes ou dune requte SQL. Le type Custom Type est utilis quand une colonne du schma (Schema Column) que vous souhaitez utiliser est dfinie par lutilisateur. Deux types de Custom sont disponibles dans le tableau Parameters. Pour le premier type : - Cochez la case quand la colonne du schma correspondant est dfinie par lutilisateur. - Si toutes les colonnes du schma dans le tableau Parameters sont de type personnalis, vous pouvez cocher la case devant Custom Type. Slectionnez un type de base de donnes dans la liste DB Type afin de mapper le type de la base de donnes source vers le type de la base de donnes cible : - Auto-Mapping : Mappe le type de la base de donnes source au type de la base de donnes cible automatiquement (par dfaut). - CLOB : Character large object - BLOB : Binary large object - DECIMAL : objet dcimal numrique - NUMERIC : caractre compris entre 0 et 9. Dans la seconde colonne Custom Type, vous pouvez prciser le type de personnalisation. Il peut tre - STRUCT : utilis pour un lment. - ARRAY : utilis pour plusieurs lments. Dans la colonne Custom name, spcifiez le type de personnalisation. Dans le tableau Parameters , si une colonne est de Type OUT, assurez-vous que son type dans le schma est bien Object. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. NLS Language NLS Territory A partir de la liste droulante, dfinissez la langue utilise pour les donnes qui ne sont pas codes en Unicode. Cochez cette case pour modifier les conventions d'appellation utilises pour la numrotation des jours et des semaines. La valeur par dfaut est celle du systme d'exploitation. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut. Dans ce cas, seuls les paramtres dentre sont autoriss.

Guide de Rfrence des Composants Talend Open Studio

761

Scnario : Vrifier le format de numros laide dune procdure stocke

Limitation

La syntaxe de la Procdure Stocke doit correspondre celle de la base de donnes. Quand le paramtre dfini dans ce composant est personnalis (Custom Type), les composants de la famille tJava doivent tre placs avant le tOracleSP, afin que les utilisateurs puissent dfinir des valeurs pour les paramtres personnaliss, ou bien aprs le tOracleSP, pour lire et crire les paramtres personnaliss de type OUT.

Scnario : Vrifier le format de numros laide dune procdure stocke


Le Job suivant permet de se connecter une base Oracle contenant des numros de scurit social et le nom de leur propritaire, en appelant une procdure stocke qui vrifie le format des numros en fonction du format standard ###-##-####. Puis le rsultat de la vrification, 1 pour un format valide et 0 pour un format non valide, est affich en sortie dans la console de la vue Run.

Cliquez et dposez les composants suivants : tOracleConnection, tOracleInput, tOracleSP et tLogRow. Reliez le composant tOracleConnection au tOracleInput laide dun lien Then Run puisquaucune donne nest traite ici. Et connectez les autres composants laide de liens Row Main puisque des lignes sont transmises comme paramtres au composant SP et la console. Dans longlet Basic settings du composant tOracleConnection, paramtrez les informations de connexion la base de donnes correspondante. Vous pourrez donc rutiliser cette information dans tout autre composant li aux bases de donnes. Puis double-cliquez sur le composant tOracleInput et paramtrez ses proprits.

Cochez la case Use an existing connection et slectionnez le composant tOracleConnection dans la liste pour rutiliser les informations de connexion dj paramtres. Slectionnez loption Repository dans le champ Property type puisque le schma Oracle est dfini dans une mtadonne du dossier Db Connections du Repository. Si vous navez pas enregistr de mtadonne contenant

762

Guide de Rfrence des Composants Talend Open Studio

Scnario : Vrifier le format de numros laide dune procdure stocke

les informations de connexion la base de donnes Oracle dans le Repository, renseignez le nom du schma manuellement. Puis slectionnez loption Repository dans le champ Schema, et rcuprez le schma correspondant la table de la base de donnes Oracle.

Dans cet exemple, la table contenant le numro de scurit social contient un schma quatre colonnes dont : ID, NAME, CITY et SSNUMBER. Dans le champ Query, saisissez la requte Select suivante ou slectionnez-la dans la liste si vous laviez stocke dans le Repository. select ID, NAME, CITY, SSNUMBER from SSN Puis slectionnez le tOracleSP et paramtrez ses proprits dans longlet Basic settings.

Comme pour le composant tOracleInput, slectionnez loption Repository dans le champ Property type et cochez la case Use an existing connection, puis slectionnez lentre adquate dans la liste Component List. Le schma utilis pour le composant tOracleSP diffre lgrement du schma dentre. En effet, une colonne supplmentaire (SSN_Valid) est ajoute au schma dentre. Cette colonne contiendra le statut de validit (1 ou 0) gnr par la procdure.

Puis slectionnez le type dencodage adquat dans la liste Encoding type. Dans le champ SP Name, saisissez le nom exact de la procdure stocke (ou de la fonction) telle quelle est appele dans la base de donnes. Dans cet exemple, le nom de la procdure stocke est is_ssn.

Guide de Rfrence des Composants Talend Open Studio

763

Scnario : Vrifier le format de numros laide dune procdure stocke

La fonction de base utilise pour cet exemple est : CREATE OR REPLACE FUNCTION is_ssn(string_in VARCHAR2) RETURN PLS_INTEGER IS -- validating ###-##-#### format BEGIN IF TRANSLATE(string_in, '0123456789A', 'AAAAAAAAAAB') = 'AAA-AA-AAAA' THEN RETURN 1; END IF; RETURN 0; END is_ssn; / Comme un valeur retourne est attendue dans cet exemple, la procdure agit comme une fonction, ainsi cochez la case Is function. La seule valeur retourne attendue est base sur la colonne ssn_valid. Ainsi, slectionnez lentre correspondante dans la liste. Dans la zone Parameters, dfinissez les paramtres dentre et de sortie utiliss dans la procdure. Dans cet exemple, seule la colonne SSNumber du schma est utilise dans la procdure. Cliquez sur le signe [+] pour ajouter un nouvelle ligne la table et slectionnez la colonne adquate (SSNumber) et son type (IN). Puis slectionnez le composant tLogRow et cliquez sur Sync Column pour rcuprer le schma du composant prcdent (tOracleSP).

Cochez la case Print values in cells of a table pour faciliter la lecture de la sortie. Puis enregistrez le Job et appuyez sur F6 pour lexcuter.

Dans la console, vous pouvez lire les rsultats en sortie. Toutes les colonnes du schma dentre sont affiches mme si elles ne sont pas utilises comme paramtres dans la procdure stocke. La colonne finale affiche la valeur retourne attendue, i.e. que le numro de scurit social vrifi soit valide ou non.

764

Guide de Rfrence des Composants Talend Open Studio

Scnario : Vrifier le format de numros laide dune procdure stocke

Consultez galement le composant la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL.

Guide de Rfrence des Composants Talend Open Studio

765

tOracleTableList

tOracleTableList

Proprits du tOracleTableList
Famille de composant Fonction Objectif Basic settings Databases/Oracle Le composant tOracleTableList effectue une opration ditration sur toutes les tables dune base de donnes, grce une connexion Oracle dfinie. Le composant tOracleTableList permet de lister les noms des tables Oracle grce aux commandes SELECT et WHERE. Component list Slectionnez le composant de connexion tOracleConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours.

Where clause for table Saisissez la commande WHERE permettant didentifier name selection les tables sur lesquelles effectuer lopration ditration. Utilisation Limitation Il faut utiliser ce composant en association avec les autres composants Oracle, notamment avec le tOracleConnection. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table .

766

Guide de Rfrence des Composants Talend Open Studio

tParAccelBulkExec

tParAccelBulkExec

Proprits du tParAccelBulkExec
Les composants tParAccelOutputBulk et tParAccelBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tParAccelOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/ParAccel Le composant tParAccelBulkExec effectue une action dInsert sur les donnes fournies. Le tParAccelBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes ParAccel. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tPation rAccelConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Guide de Rfrence des Composants Talend Open Studio

767

Proprits du tParAccelBulkExec

Schema

Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Advanced settings Copy mode Slectionnez le mode de Copy que vous souhaitez utiliser. Basic : Mode classique, sans optimisation. Parallel : Mode permettant dutiliser plusieurs API internes ParAccel, afin damliorer les performances de chargement. Filename File Type Field Layout Field separator Explicit IDs Remove Quotes Max. Errors Date Format Time/Timestamp mat Nom du fichier traiter et chemin daccs. Slectionnez dans la liste le type de fichier. Slectionnez dans la liste la disposition du fichier. Caractre, chane ou expression rgulire sparant les champs (si vous chargez un fichier dlimit). LID sera assign directement par la base de donnes ou est dj prsent dans le fichier charger. Cochez cette case afin de retirer les guillemets de votre fichier charger. Saisissez le nombre maximal derreurs avant que votre Job ne sarrte. Saisissez le format de date qui sera utilis. For- Saisissez le format de date et heure qui sera utilis.

Action on table

Additional COPY Op- Saisissez loption spcifique ParAccel et personnalise tions que vous souhaitez utiliser. Log file Logging level tStatCatcher Statistics Saisissez le chemin daccs votre fichier de log, ou parcourez votre rpertoire. Slectionnez le niveau de verbose retourner. Cochez cette case pour collecter les donnes de log au niveau du composant.

768

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Utilisation

Ce composant est gnralement utilis avec un composant tParAccelOutputBulk. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes ParAccel. n/a

Limitation

Scnarios associs
Pour plus dinformations relatives au fonctionnement de tParAccelBulkExec, consultez les scnarios suivants dans : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du composant tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du composant tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

769

tParAccelClose

tParAccelClose

Proprits du tParAccelClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/ParAccel Le composant tParAccelClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes ParAccel. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tParAccelConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tParAccelConnection et tParAccelRollback. Il est gnralement utilis avec un composant tParAccelConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tParAccelClose, consultez la section intitule tMysqlConnection

770

Guide de Rfrence des Composants Talend Open Studio

tParAccelCommit

tParAccelCommit

Proprits du tParAccelCommit
Ce composant est troitement li aux composants tParAccelCommit et tParAccelRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/ParAccel Le composant tParAccelCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tParAccelConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tParAccelCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants ParAccel et notamment tParAccelConnection et tParAccelRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tParAccelConnection et tParAccelRollback. Ils sont gnralement utiliss avec un composant tParAccelConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tParAccelCommit, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

771

tParAccelConnection

tParAccelConnection

Proprits du tParAccelConnection
Ce composant est troitement li aux composants tParAccelCommit et tParAccellRollback. Ils sont gnralement utiliss avec un composant tParAccelConnection car il permet douvrir une connexion pour la transaction en cours.

Famille de composant Fonction Objectif Basic settings

Databases/ParAccel Le composant tParAccelConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants ParAccel, notamment les composants tParAccelCommit et tParAccelRollback. n/a

772

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Scnario associ
Ce composant est troitement li aux composants tParAccelCommit et tParAccelRollback. Ils sont gnralement utiliss avec un composant tParAccelConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tParAccelConnection, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

773

tParAccelInput

tParAccelInput

Proprits du tParAccelInput
Famille de composant Fonction Objectif Databases/ ParAccel Le composant tParAccelInput lit une base de donnes et en extrait des champs laide de requtes. Le tParAccelInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tPation rAccelConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio.

Basic settings

774

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Host Port Database Schema

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type et Query Nom de la table de base de donnes. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cochez cette case et dfinissez le nombre de lignes avec lesquelles vous souhaitez travailler en une fois. Cette option permet doptimiser les performances.

Advanced settings

Use cursor

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Utilisation Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes ParAccel.

Scnarios associs
Pour un scnario associ, consultez les scnarios du composant tParAccelInput : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery

Guide de Rfrence des Composants Talend Open Studio

775

tParAccelOutput

tParAccelOutput

Proprits du tParAccelOutput
Famille de composant Fonction Objectif Basic settings Databases/ParAccel Le composant tParAccelOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tParAccelOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tPation rAccelConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Adresse IP du serveur de base de donnes.

776

Guide de Rfrence des Composants Talend Open Studio

Proprits du tParAccelOutput

Port Database Schema

Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Guide de Rfrence des Composants Talend Open Studio

777

Scnarios associs

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tParAccelOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Commit every

Additional Columns

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes ParAccel. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au composant tParAccelOutput consultez :

778

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la section intitule Scnario : Afficher la base de donnes en sortie du tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

779

tParAccelOutputBulk

tParAccelOutputBulk

Proprits du tParAccelOutputBulk
Les composants tParAccelOutputBulk et tParAccelBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tParAccelOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/ParAccel Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards ParAccel. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes ParAccel. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Include header Encoding Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

780

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec le composant tParAccelBulkExec. Ensemble ils offrent un gain de performance important pour lalimentation dune base de donnes ParAccel.

Scnarios associs
Pour un scnario associ au composant tParAccelOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

781

tParAccelOutputBulkExec

tParAccelOutputBulkExec

Proprits du tParAccelOutputBulkExec
Les composants tParAccelOutputBulk et tParAccelBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tParAccelOutputBulkExec.

Famille de composant Fonction Objectif Basic settings

Databases/ParAccel Le tParAccelOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tParAccelOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes ParAccel. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None: neffectuer aucune opration de table. Drop and create the table: supprimer la table puis en crer une nouvelle. Create a table: crer une table qui nexiste pas encore. Create table if doesnt exist: crer la table si ncessaire. Clear a table: supprimer le contenu de la table. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository.

Action on table

782

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Copy mode Slectionnez le mode de Copy que vous souhaitez utiliser. Basic : Mode classique, sans optimisation. Parallel : Mode permettant dutiliser plusieurs API internes ParAccel, afin damliorer les performances de chargement. Filename File Type Field Layout Field separator Explicit IDs Remove Quotes Max. Errors Date Format Time/Timestamp mat Nom du fichier traiter et chemin daccs. Slectionnez dans la liste le type de fichier. Slectionnez dans la liste la disposition du fichier. Caractre, chane ou expression rgulire sparant les champs (si vous chargez un fichier dlimit). LID sera assign directement par la base de donnes ou est dj prsent dans le fichier charger. Cochez cette case afin de retirer les guillemets de votre fichier charger. Saisissez le nombre maximal derreurs avant que votre Job ne sarrte. Saisissez le format de date qui sera utilis. For- Saisissez le format de date et heure qui sera utilis.

Additional COPY Op- Saisissez loption spcifique ParAccel et personnalise tions que vous souhaitez utiliser. Log file Logging level tStatCatcher Statistics Utilisation Saisissez le chemin daccs votre fichier de log, ou parcourez votre rpertoire. Slectionnez le niveau de verbose retourner. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes.

Scnarios associs
Pour un scnario associ au composant tParAccelOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

783

Scnarios associs

la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

784

Guide de Rfrence des Composants Talend Open Studio

tParAccelRollback

tParAccelRollback

Proprits du tParAccelRollback
Ce composant est troitement li aux composants tParAccelCommit et tParAccelConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/ParAccel Le tParAccelRollback annule la transaction dans une base de donnes connecte. Ce composant permet dviter le commit de transaction involontaire. Component list Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tParAccelConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants ParAccel, notamment les composants tParAccelConnection et tParAccelCommit. n/a

Scnario associ
Pour un scnario associ au composant tParAccelRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

Guide de Rfrence des Composants Talend Open Studio

785

tParAccelRow

tParAccelRow

Proprits du tParAccelRow
Famille de composant Fonction Databases/ParAccel Le tParAccelRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tParAccelRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tPation rAccelConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma

Objectif

Basic settings

786

Guide de Rfrence des Composants Talend Open Studio

Proprits du tParAccelRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Table name Query type Nom de la table de base lire. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution.

Guide de Rfrence des Composants Talend Open Studio

787

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

788

Guide de Rfrence des Composants Talend Open Studio

tParAccelSCD

tParAccelSCD

Le composant tParAccelSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tParAccelSCD .

Guide de Rfrence des Composants Talend Open Studio

789

tParseRecordSet

tParseRecordSet

Proprits du tParseRecordSet
Ce composant se trouve la racine de la famille Databases de la Palette de Talend Open Studio. Le composant tParseRecordSet couvre des besoins indirectement lis lutilisation des bases de donnes de tout type. Famille de composant Fonction Databases Le composant tParseRecordSet analyse un ensemble denregistrements dune table de donnes ou dune requte SQL et retourne ventuellement des enregistrements seuls. Il permet danalyser un ensemble denregistrements dune table au lieu de les analyser individuellement. Prev. Comp. Column list Slectionnez la colonne denregistrements analyser. contenant lensemble

Objectif Basic settings

Schema et Edit Schema Dans une procdure stocke, le schma est un paramtre dentre. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant uniquement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il est rutilisable. Voir galement : Guide utilisateur de Talend Open Studio. Attribute table Utilisation Limitation Paramtrez la valeur positionnelle de chaque colonne de chaque enregistrement dun ensemble denregistrements.

Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut. Dans ce cas, seuls les paramtres dentre sont autoriss. Ce composant est principalement utilis avec la fonctionnalit Recordset dun composant SP.

Scnario associ
Pour un exemple dutilisation du tParseRecordSet, consultez la section intitule Scnario 2 : Utiliser linstance PreparedStatement pour faire une requte sur des donnes .

790

Guide de Rfrence des Composants Talend Open Studio

tPostgresPlusBulkExec

tPostgresPlusBulkExec

Proprits du tPostgresPlusBulkExec
Les composants tPostgresPlusOutputBulk et tPostgresPlusBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tPostgresPlusOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/PostgresPlus Le composant PostgresPlusBulkExec excute des oprations dInsert sur les donnes fournies. Le tPostgresPlusBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes DB2. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tPostgrestion qlConnection adquat partir de la liste Component List pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Adresse IP du serveur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

791

Scnario associ

Port Database Schema

Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification sur lutilisateur de base de donnes. Table Action on table Nom de la table crire. Notez quune seule table peut tre crite la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None: neffectuer aucune opration de table. Drop and create the table: supprimer la table puis en crer une nouvelle. Create a table: crer une table qui nexiste pas encore. Create table if doesnt exist: crer la table si ncessaire. Clear a table: supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Filename Nom du fichier traiter. Voir galement : Guide utilisateur de Talend Open Studio. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Advanced settings Action Slectionnez lopration que vous voulez effectuer : Bulk insert Bulk update Les informations demandes seront diffrentes en fonction de laction choisie. Field terminated by tStatCatcher Statistics Utilisation Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes Postgresplus.

Scnario associ
Pour un scnario associ au composant tPostgresPlusBulkExec, consultez :

792

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

793

tPostgresPlusClose

tPostgresPlusClose

Proprits du tPostgresPlusClose
Famille de composant Fonction Objectif Basic settings Databases/PostgresPlus Le composant tPostgresPlusClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes PostgresPlus. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tPostgresPlusConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tPostgresPlusConnection et tPostgresPlusRollback. Il est gnralement utilis avec un composant tPostgresPlusConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tPostgresPlusClose, consultez la section intitule tMysqlConnection

794

Guide de Rfrence des Composants Talend Open Studio

tPostgresPlusCommit

tPostgresPlusCommit

Proprits du tPostgresPlusCommit
Ce composant est troitement li aux composants tpostgresPlusConnection et tPostgresPlusRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/PostgresPlus Le composant tPostgresPlusCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tPostgresPlusConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tPostgresPlusCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Close connection

Ce composant est gnralement utilis avec des composants PostgresPlus et notamment avec les composants tPostgresPlusConnection et tPostgresPlusRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tPostgresPlusConnection et tPostgresPlusRollback. Ils sont gnralement utiliss avec un composant tPostgresPlusConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tPostgresPlusCommit, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

795

tPostgresPlusConnection

tPostgresPlusConnection

Proprits du tPostgresPlusConnection
Ce composant est troitement li aux composants tPostgresPlusCommit et tPostgresPlusRollback. Ils sont gnralement utiliss avec un composant tPostgresPlusConnection car il permet douvrir une connexion pour la transaction en cours.

Famille de composant Fonction Objectif Basic settings

Databases/PostgresPlus Le composant tPostgresPlusConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants PostgresPlus et notamment avec les composants tPostgresPlusCommit et tPostgresPlusRollback. n/a

796

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Scnario associ
Ce composant est troitement li aux composants tPostgresPlusCommit et tPostgresPlusRollback. Ils sont gnralement utiliss avec un composant tPostgresPlusConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tPostgresPlusConnection; consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

797

tPostgresPlusInput

tPostgresPlusInput

Proprits du tPostgresPlusInput
Famille de composant Fonction Objectif Databases/ PostgresPlus Le composant tPostgresPlusInput lit une base de donnes et en extrait des champs laide de requtes. Le tPostgresPlusInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tPostgresPlusConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio.

Basic settings

798

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Host Port Database Schema

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type et Query Nom de la table de base de donnes. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cochez cette case et dfinissez le nombre de lignes avec lesquelles vous souhaitez travailler en une fois. Cette option permet doptimiser les performances

Advanced settings

Use cursor

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Utilisation Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes PostgresPlus.

Scnarios associs
Pour un scnario associ, consultez les scnarios du composant tPostgresPlusInput : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery

Guide de Rfrence des Composants Talend Open Studio

799

tPostgresPlusOutput

tPostgresPlusOutput

Proprits du tPostgresPlusOutput
Famille de composant Fonction Objectif Basic settings Databases/PostgresPlus Le tPostgresPlusOutput crit, met jour, effectue les changements ou supprime les entres dans une base de donnes. Le tPostgresPlusOutput excute laction dfinie sur la table et/ou sur les donnes contenues dans la table, partir du flux entrant du composant prcdent dans le Job. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case si vous utilisez composant tPostgrestion PlusConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Adresse IP du serveur de base de donnes.

800

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPostgresPlusOutput

Port Database Schema

Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant

Action on table

Guide de Rfrence des Composants Talend Open Studio

801

Proprits du tPostgresPlusOutput

la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete) Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job Designs. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tPostgresqlOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

Commit every

Additional Columns

Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement dune table de base de donnes. Assurez-vous que la case Nullable est bien coche pour les colonnes du schma correspondantes. Use Batch size Cochez cette case afin dactiver le mode batch pour le traitement des donnes. Dans le champ Batch Size qui appa-

802

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

rat, vous pouvez saisir le nombre de lignes par lot charger. Cette case est disponible uniquement si vous avez choisi loption Insert, Update, Single Insert Query ou Delete dans le champ Action on data. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes PostgresPlus. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour des scnarios associs, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

803

tPostgresPlusOutputBulk

tPostgresPlusOutputBulk

Proprits du tPostgresPlusOutputBulk
Les composants tPostgresPlusOutputBulk et tPostgresPlusBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tPostgresPlusOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/PostgresPlus Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards Postgresql. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes Postgresql. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job Designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Include header Encoding Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

804

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec le composant tPostgresPlusBulkExec. Ensemble ils offrent un gain de performance important pour lalimentation dune base de donnes PostgresPlus.

Scnarios associs
Pour un scnario associ au composant tPostgresPlusOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

805

tPostgresPlusOutputBulkExec

tPostgresPlusOutputBulkExec

Proprits du tPostgresplusOutputBulkExec
Les composants tPostgresPlusOutputBulk et tPostgresPlusBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tPostgresPlusOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/Postgresplus Le tPostgresPlusOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tPostgresPlusOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes PostgresPlus. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. File Name Nom du fichier traiter. Voir galement : Guide utilisateur de Talend Open Studio. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant

Action on table

806

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Advanced settings Action Slectionnez lopration que vous voulez effectuer : Bulk insert Bulk update Les informations demandes seront diffrentes en fonction de laction choisie. File type Null string Row separator Fields terminated by Slectionnez le type de fichiers traiter. Chane de caractres affiche pour signifier que la valeur est nulle. Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs : None : aucun caractre de sparation. Whitespace : le caractre de sparation est un espace. EOF (used for loading LOBs from lobfile) : la sparation est constitue dun caractre de fin de fichier (End Of File). Other terminator : la sparation est constitue dun caractre autre que ceux prcdemment noncs. Escape character tStatCatcher Statistics Utilisation Caractre dchappement de la ligne. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes.

Scnarios associs
Pour un scnario associ au composant tPostgresPlusOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

807

tPostgresPlusRollback

tPostgresPlusRollback

Proprits du tPostgresPlusRollback
Ce composant est troitement li aux composants tPostgresPlusCommit et tPostgresPlusConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/PostgresPlus Le tPostgresPlusRollback annule la transaction dans une base de donnes connecte. Ce composant permet dviter le commit de transaction involontaire. Component list Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tPostgresPlusConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants PostgresPlus, notamment les composants tPostgresPlusConnection et tPostgresPlusCommit. n/a

Scnario associ
Pour un scnario associ au composant tPostgresPlusRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

808

Guide de Rfrence des Composants Talend Open Studio

tPostgresPlusRow

tPostgresPlusRow

Proprits du tPostgresPlusRow
Famille de composant Fonction Databases/PostgresPlus Le tPostgresPlusRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tPostgresPlusRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tPostgresPlusConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

809

Proprits du tPostgresPlusRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Table name Query type Nom de la table de base lire. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution.

810

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

811

tPostgresPlusSCD

tPostgresPlusSCD

Le composant tPostgresPlusSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tPostgresPlusSCD .

812

Guide de Rfrence des Composants Talend Open Studio

tPostgresPlusSCDELT

tPostgresPlusSCDELT

Le composant tPostgresPlusSCDELT appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tPostgresPlusSCDELT .

Guide de Rfrence des Composants Talend Open Studio

813

tPostgresqlBulkExec

tPostgresqlBulkExec

Proprits du tPostgresqlBulkExec
Les composants tPostgresqlOutputBulk et tPostgresqlBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tPostgresqlOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Postgresql Le composant tPostgresqlBulkExec permet dinsrer les donnes dune base de donnes Postgresql. Le tPostgresqlBulkExec est un composant ddi, il permet un gain de performance lors du traitement des donnes de la base de donnes Postgresql. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tPostgresqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

814

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPostgresqlBulkExec

Schema

Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. File Name Nom du fichier traiter. Voir galement : Guide Utilisateur de Talend Open Studio. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Advanced settings Action on data Slectionnez lopration que vous voulez effectuer : Bulk insert Bulk update Les informations demandes seront diffrentes en fonction de laction choisie. Copy the OID for each Rcupre les identifiants dobjet pour chaque ligne. row Contains a header line Spcifiez que la table contient des lignes den-tte. with the names of each column in the file File type Null string Fields terminated by Escape char Text enclosure Slectionnez le type de fichiers traiter. Chane de caractres affiche pour signifier que la valeur est nulle. Caractre, chane ou expression rgulire sparant les champs. Caractre dchappement de la ligne. Caractres utiliss pour entourer le texte.

Action on table

Use Activez la variable standard_conforming_string ON Force not null for co- Dfinissez la nullabilit des colonnes lumns

Guide de Rfrence des Composants Talend Open Studio

815

Scnarios associs

Force not null : Cochez la case correspondant la colonne (Column) que vous souhaitez dfinir comme ntant pas nulle. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant doit tre utilis en association avec le composant tPostgresqlOutputBulk. Ensemble, ils permettent dobtenir des gains de performances dans une base de donnes Postgresql. n/a

Limitation

Scnarios associs
Pour dautres exemples dutilisation du composant tPostgresqlBulkExec, consultez les scnarios suivants dans : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk, la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec, la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

816

Guide de Rfrence des Composants Talend Open Studio

tPostgresqlClose

tPostgresqlClose

Proprits du tPostgresqlClose
Famille de composant Fonction Objectif Basic settings Databases/Postgresql Le composant tPostgresqlClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Postgresql. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tPostgresqlConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tPostgresqlConnection et tPostgresqlRollback. Il est gnralement utilis avec un composant tPostgresqlConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tPostgresqlClose, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

817

tPostgresqlCommit

tPostgresqlCommit

Proprits du tPostgresqlCommit
Ce composant est troitement li aux composants tPostgresqlConnection et tPostgresqlRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Postgresql Le composant tPostgresqlCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Slectionnez le composant tPostgresqlConnection dans la liste sil y a plus dune connexion dans votre Job. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tPostgresqlCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Postgresql, notamment les composants tPostgresqlConnection et tPostgresqlRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tPostgresqlConnection et tPostgresqlRollback. Ils sont gnralement utiliss avec un composant tPostgresqlConnection car celui-ci permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tPostgresqlCommit, consultez la section intitule tMysqlConnection .

818

Guide de Rfrence des Composants Talend Open Studio

tPostgresqlConnection

tPostgresqlConnection

Proprits du tPostgresqlConnection
Ce composant est troitement li aux composants tPostgresqlCommit et tPostgresqlRollback. Ils sont gnralement utiliss avec un composant tPostgresqlConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Postgresql Le composant tPostgresqlConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants Oracle, notamment les composants tPostgresqlCommit et tPostgresqlRollback. n/a

Guide de Rfrence des Composants Talend Open Studio

819

Scnario associ

Scnario associ
Ce composant est troitement li aux composants tPostgresqlCommit et tPostgresqlRollback. Ils sont gnralement utiliss avec un composant tPostgresqlConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tPostgresqlConnection, consultez la section intitule tMysqlConnection

820

Guide de Rfrence des Composants Talend Open Studio

tPostgresqlInput

tPostgresqlInput

Proprits du tPostgresqlInput
Famille de composant Fonction Objectif Databases/ Postgresql Le composant tPostgresqlInput lit une base de donnes et en extrait des champs laide de requtes. Le tPostgresqlInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tPostgresqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

821

Scnarios associs

Host Port Database Schema

Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Table Name Query type et Query Nom de la table lire. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cochez cette case et dfinissez le nombre de lignes avec lesquelles vous souhaitez travailler en une fois. Cette option permet doptimiser les performances.

Advanced settings

Use cursor

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Utilisation Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Postgresql.

Scnarios associs
Pour un scnario associ, consultez les scnarios du composant tPostgresqlInput : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery

822

Guide de Rfrence des Composants Talend Open Studio

tPostgresqlOutput

tPostgresqlOutput

Proprits du tPostgresqlOutput
Famille de composant Fonction Objectif Basic settings Databases/Postgresql Le composant tPostgresqlOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tPostgresqlOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tPostgresqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Adresse IP du serveur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

823

Proprits du tPostgresqlOutput

Port Database Schema

Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Username et Password Informations dauthentification de lutilisateur de la base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop a table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de

824

Guide de Rfrence des Composants Talend Open Studio

Proprits du tPostgresqlOutput

mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tPostgresqlOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

Commit every

Additional Columns

Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement dune table de base de donnes. Assurez-vous que la case Nullable est bien coche pour les colonnes du schma correspondantes. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Guide de Rfrence des Composants Talend Open Studio

825

Scnarios associs

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Postgresql. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au composant tPostgresqlOutput consultez : la section intitule Scnario : Afficher la base de donnes en sortie du tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du tMysqlOutput.

826

Guide de Rfrence des Composants Talend Open Studio

tPostgresqlOutputBulk

tPostgresqlOutputBulk

Proprits du tPostgresqlOutputBulk
Les composants tPostgresqlOutputBulk et tPostgresqlBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tPostgresqlOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Postgresql Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards Postgresql. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes Postgresql. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Include header Encoding Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

827

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec le composant tPostgresqlBulkExec. Ensemble ils offrent un gain de performance important pour lalimentation dune base de donnes Postgresql.

Scnarios associs
Pour un scnario associ au composant tPostgresqlOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

828

Guide de Rfrence des Composants Talend Open Studio

tPostgresqlOutputBulkExec

tPostgresqlOutputBulkExec

Proprits du tPostgresqlOutputBulkExec
Les composants tPostgresqlOutputBulk et tPostgresqlBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tPostgresqlOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/Postgresql Le tPostgresqlOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tPostgresqlOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Postgresql. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None: neffectuer aucune opration de table. Drop and create the table: supprimer la table puis en crer une nouvelle. Create a table: crer une table qui nexiste pas encore. Create table if doesnt exist: crer la table si ncessaire. Drop a table if exists and create: supprimer la table si elle existe dj, puis en crer une nouvelle. Clear a table: supprimer le contenu de la table. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio.

Action on table

Guide de Rfrence des Composants Talend Open Studio

829

Scnarios associs

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Action on data Slectionnez lopration que vous voulez effectuer : Bulk insert Bulk update Les informations demandes seront diffrentes en fonction de laction choisie. Copy the OID for each Rcupre les identifiants dobjet pour chaque ligne. row Contains a header line Spcifiez que la table contient des lignes den-tte. with the names of each column in the file Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Slectionnez le type de fichiers traiter. Chane de caractres affiche pour signifier que la valeur est nulle. Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Caractre dchappement de la ligne. Caractres utiliss pour entourer le texte.

File type Null string Row separator Fields terminated by Escape char Text enclosure

Activate Activez le paramtre standard_conforming_string pour standard_conforming_string traiter les backslashs comme une chane ordinaire et non pas comme un caractre dchappement. Force not null for co- Dfinissez la nullabilit des colonnes lumns Force not null : Cochez la case correspondant la colonne (Column) que vous souhaitez dfinir comme ntant pas nulle. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes.

Scnarios associs
Pour un scnario associ au composant tPostgresqlOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk.

830

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

831

tPostgresqlRollback

tPostgresqlRollback

Proprits du tPostgresqlRollback
Ce composant est troitement li aux composants tPostgresqlCommit et tPostgresqlConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/Postgresql Le tPostgresqlRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tPostgresqlConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants Postgresql, notamment les composants tPostgresqlConnection et tPostgresqlCommit. n/a

Scnario associ
Ce composant est troitement li aux composants tPostgresqlConnection et tPostgresqlCommit. Ils sont gnralement utiliss avec un composant tPostgresqlConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tPostgresqlRollback, consultez la section intitule tMysqlRollback

832

Guide de Rfrence des Composants Talend Open Studio

tPostgresqlRow

tPostgresqlRow

Proprits du tPostgresqlRow
Famille de composant Fonction Databases/Postgresql Le tPostgresqlRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tPostgresqlRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tion tPostgresqlConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

833

Proprits du tPostgresqlRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table lire. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution.

834

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnarios associs
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

835

tPostgresqlSCD

tPostgresqlSCD

Le composant tPostgresqlSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tPostgresqlSCD .

836

Guide de Rfrence des Composants Talend Open Studio

tPostgresqlSCDELT

tPostgresqlSCDELT

Le composant tPostgresqlSCDELT appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tPostgresqlSCDELT .

Guide de Rfrence des Composants Talend Open Studio

837

tSASInput

tSASInput

Assurez-vous dinstaller au pralable les modules sas.core.jar, sas.intrnet.javatools.jar et sas.svc.connection.jar sous le chemin lib > java dans votre build Talend Open Studio pour pouvoir utiliser toutes les fonctionnalits des composants SAS. Vous pouvez vrifier que ces modules ont bien t installs partir de la vue Modules de votre studio.

Proprits du tSASInput
Famille de composant Fonction Objectif Databases/SAS Le composant tSASInput lit une base de donnes et en extrait des champs laide de requtes. Le tSASInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio . Host name Port Librefs Nom ou adresse IP du serveur SAS. Port dcoute ouvrir. Renseignez le nom du rpertoire physique dans lequel est contenue la table lire, suivi de son chemin daccs. Par exemple : TpSas C:/SAS/TpSas Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio.

Basic settings

838

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Renseignez le nom de la table lire, prfix par le nom du rpertoire physique dans lequel elle est contenue. Par exemple : TpSas.Customers. La requte peut tre construite manuellement (Built-in) pour un Job particulier ou stocke dans le Repository sil sagit dune requte frquemment utilise, pour en faciliter lutilisation. Saisissez votre requte, si elle nest pas stocke dans le Repository, en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cochez cette case pour collecter les donnes de log au niveau du composant.

Query type

Query

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes utilisant une connexion SAS.

Scnarios associs
Pour un scnario associ, consultez les scnarios du composant tDBInput : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du composant tContextLoad.

Guide de Rfrence des Composants Talend Open Studio

839

tSASOutput

tSASOutput

Assurez-vous dinstaller au pralable les modules sas.core.jar, sas.intrnet.javatools.jar et sas.svc.connection.jar sous le chemin lib > java dans votre build Talend Open Studio pour pouvoir utiliser toutes les fonctionnalits des composants SAS. Vous pouvez vrifier que ces modules ont bien t installs partir de la vue Modules de votre studio.

Proprits du tSASOutput
Famille de composant Fonction Objectif Basic settings Databases/SAS Le composant tSASOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tSASOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Use an existing connec- Cochez cette case et slectionnez le composant tSASContion nection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. SAS URL Driver JAR Entrez le chemin daccs la base de donnes. Slectionnez le driver JAR partir de la liste droulante ou cliquez sur les trois points [...] pour ajouter un nouveau JAR la liste. Dans le champ Class name, renseignez le nom de la classe pour quelle soit indique dans le driver.

Class Name

840

Guide de Rfrence des Composants Talend Open Studio

Proprits du tSASOutput

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on data Nom de la table lire. Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Clear data in table Cochez cette case pour que les donnes soient supprimes de la table slectionne avant toute action.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide Utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Guide de Rfrence des Composants Talend Open Studio

841

Scnarios associs

Advanced settings

Commit every

Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tSASOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier.

Additional Columns

Use field options Enable debug mode tStatCatcher Statistics Utilisation

Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes utilisant une connexion SAS. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes SAS. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnarios associs
Pour un scnario associ au tSASOutput, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

842

Guide de Rfrence des Composants Talend Open Studio

tSQLiteClose

tSQLiteClose

Proprits du tSQLiteClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/SQLite Le composant tSQLiteClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes SQLite. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tSQLiteConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tSQLiteConnection et tSQLiteRollback. Il est gnralement utilis avec un composant tSQLiteConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tSQLiteClose, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

843

tSQLiteCommit

tSQLiteCommit

Proprits du tSQLiteCommit
Ce composant est troitement li aux composants tSQLiteConnection et tSQLiteRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/SQLite Le composant tSQLiteCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Slectionnez le composant tSQLiteConnection dans la liste sil y a plus dune connexion dans votre Job. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tSQLiteCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants SQLite, notamment les composants tSQLiteConnection et tSQLiteRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tSQLiteConnection et tSQLiteRollback. Ils sont gnralement utiliss avec un composant tSQLiteConnection car celui-ci permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tSQLiteCommit, consultez la section intitule tMysqlConnection .

844

Guide de Rfrence des Composants Talend Open Studio

tSQLiteConnection

tSQLiteConnection

Proprits du tSQLiteConnection
Ce composant est troitement li aux composants tSQLiteCommit et tSQLiteRollback. Ils sont gnralemet utiliss avec un composant tSQLiteConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/SQLite Le composant tSQLiteConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Database Table Schema Nom de la base de donnes. Nom du schma.

Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants SQLite, notamment les composants tSQLiteCommit et tSQLiteRollback. n/a

Scnarios associs
Ce composant est troitement li aux composants tSQLiteCommit et tSQLiteRollback. Ils sont gnralement utiliss avec un composant tSQLiteConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tSQLiteConnection, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

845

tSQLiteInput

tSQLiteInput

Proprits du tSQLiteInput
Famille de composant Fonction Databases/SQLite Le composant tSQLiteInput lit une base de donnes et en extrait des champs laide de requtes. Un petit moteur de base de donnes SQLite lui est intgr, il na donc pas besoin dtre connect un serveur de base de donnes. Le tSQLiteInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tSQLitetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant.

Objectif

Basic settings

846

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer des donnes SQlite

Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio . Database Chemin daccs au fichier de la base de donnes SQLite. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Query type La requte peut tre construite manuellement (Built-in) pour un Job particulier ou stocke dans le Repository sil sagit dune requte frquemment utilise, pour en faciliter lutilisation. Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma.

Query

Advanced settings

Trim all the String/Char Supprimer les espaces en dbut et en fin de champ dans columns les colonnes slectionnes. Trim column Cochez cette case pour collecter les donnes de log au niveau du composant.

tStat Catcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Utilisation Ce composant est tout fait autonome du fait de son moteur de base de donnes SQLite intgr. Il sagit dun composant de dbut pouvant initier un traitement de flux de donnes.

Scnario : Filtrer des donnes SQlite


Le scnario suivant dcrit un Job assez simple qui permet dappliquer une requte donne utilisant un filtre pour extraire des lignes partir dune base de donnes SQLite source et alimenter une table SQLite en sortie.

Cliquez-dposez partir de la Palette les composants tSQLiteInput et tSQLiteOutput. Reliez le composant dentre et de sortie laide dun lien de type row Main. Dans longlet Basic settings du composant tSQLiteInput, entrez le chemin daccs ou parcourez vos dossiers jusquau fichier dentre la base de donne SQLite.

Guide de Rfrence des Composants Talend Open Studio

847

Scnario : Filtrer des donnes SQlite

Le fichier contient des centaines de lignes et comprend une colonne ip servant de base la requte. Dans longlet Basic settings du composant tSQLiteInput, modifiez le schma afin quil corresponde la structure de la table.

Dans le champ Query, renseignez la requte choisie par rapport la colonne ip. Slectionnez les paramtres dencodage correspondants. Pour le composant tSQLiteOutput, dans le champ Database de longlet Basic settings, slectionnez le chemin daccs la base de donnes de sortie.

Dans le champ Table, renseignez le nom de la table alimenter avec les donnes slectionnes.

848

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer des donnes SQlite

A partir des listes droulantes Action on table et Action on Data, slectionnez les actions effectuer sur la table et sur les donnes. Dans le cas prsent, les actions sont, respectivement, Drop and create et Insert. Synchronisez le schma avec le schma dentre. Slectionnez lencodage puis dfinissez la limite de commit. Enregistrez le Job puis excutez-le en appuyant sur F6.

Les donnes slectionnes sont renvoyes vers le fichier SQLite dfini.

Guide de Rfrence des Composants Talend Open Studio

849

tSQLiteOutput

tSQLiteOutput

Proprits du tSQLiteOutput
Famille de composant Fonction Databases/SQLite Le composant tSQLiteOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Un petit moteur de base de donnes SQLite lui est intgr, il na donc pas besoin dtre connect un serveur de base de donnes. Le tSQLiteOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tStion QLiteConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio .

Objectif Basic settings

850

Guide de Rfrence des Composants Talend Open Studio

Proprits du tSQLiteOutput

Database Table Action on table

Chemin daccs au fichier de la base de donnes. Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Action on data

Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete. Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository.

Guide de Rfrence des Composants Talend Open Studio

851

Scnario associ

Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tSQLiteOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode tStatCatcher Statistics Utilisation Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Commit every

Additional Columns

Ce composant doit absolument tre reli un composant dentre (Input). Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes SQLite. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnario associ
Pour un scnario associ au composant tSQLiteOutput, consultez la section intitule tSQLiteInput .

852

Guide de Rfrence des Composants Talend Open Studio

tSQLiteRollback

tSQLiteRollback

Proprits du tSQLiteRollback
Ce composant est troitement li aux composants tSQLiteCommit et tSQLiteConnection. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Databases/SQLite Le tSQLiteRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Slectionnez le composant de connexion tSQLiteConnection dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics

Il faut utiliser ce composant en association avec des composants SQLite, notamment avec le tSQLiteConnection et le tSQLiteCommit. n/a

Scnario associ
Pour un scnario associ au tSQLiteRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMySQLRollback.

Guide de Rfrence des Composants Talend Open Studio

853

tSQLiteRow

tSQLiteRow

Proprits du tSQLiteRow
Famille de composant Fonction Objectif Databases/SQLite Le tSQLiteRow excute une requte dfinie dans une base de donnes spcifie et utilise les paramtres de la colonne. Une requte prdfinie utilise le flux dentre pour remplacer les paramtres substituables par les valeurs dfinies pour chaque paramtre. Ce composant est trs utile quand il sagit de faire des mises jour. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tStion QLiteConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Database Chemin daccs au fichier de la base de donnes SQLite. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository.

Basic settings

854

Guide de Rfrence des Composants Talend Open Studio

Scnario : Mettre jour des lignes SQLite

Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table lire. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every tStatCatcher Statistics Nombre de lignes avant le commit. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnario : Mettre jour des lignes SQLite


Le scnario suivant dcrit un Job qui permet de mettre jour un fichier de base de donne SQLite en utilisant une requte prdfinie et un fichier dlimit.

Guide de Rfrence des Composants Talend Open Studio

855

Scnario : Mettre jour des lignes SQLite

Cliquez-dposez les composants tFileInputDelimited et tSQLiteRow. Dans longlet Basic settings du composant tFileInputDelimited, parcourez les dossiers et slectionnez le fichier dentre utiliser pour mettre jour les lignes dans la base de donnes.

Il ny a ni en-tte (Header) ni pied de page (Footer). Le sparateur de lignes (Row separator) est un retour chariot et le sparateur de champs (Field separator) un point-virgule. Modifiez le schma sil nest pas stock dans le Repository.

Assurez-vous que la longueur et le type dfinissent correctement les colonnes. Dans lespace de modlisation graphique, double-cliquez sur le composant tSQLiteRow pour afficher sa vue Component. Dans longlet Basic settings du composant tSQLiteRow, renseignez le champ Database avec le chemin daccs au fichier mettre jour.

856

Guide de Rfrence des Composants Talend Open Studio

Scnario : Mettre jour des lignes SQLite

Le schma est en mode read-only puisquil doit correspondre au schma dentre. Saisissez la requte ou rcuprez-la partir du Repository. Dans le cas prsent, la colonne type_os a t mise jour en fonction de la valeur id dfinie dans le flux entrant. La requte se prsente comme suit : Update download set type_os=? where id=? Dans longlet Advanced Settings, cochez la case Use PreparedStatement pour afficher la table des paramtres substituables.

Dans la table des paramtres dentre, ajoutez autant de lignes quil y a de paramtres substituables. Dans cet exemple, dfinissez type_os et id. Renseignez le champ Commit every. Enregistrez le Job et appuyez sur F6 pour lexcuter. La table download de la base de donnes SQLite est ainsi mise jour avec le nouveau code type_os, selon le fichier dlimit dentre.

Guide de Rfrence des Composants Talend Open Studio

857

tSybaseBulkExec

tSybaseBulkExec

Proprits du tSybaseBulkExec
Les composants tSybaseOutputBulk et tSybaseBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tSybaseOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases Le composant tSybaseBulkExec permet dinsrer les donnes dune base de donnes Sybase. Le tSybaseBulkExec est un composant ddi, il permet un gain de performance lors du traitement des donnes de la base de donnes Sybase. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tSybasetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Server Adresse IP du serveur de base de donnes.

858

Guide de Rfrence des Composants Talend Open Studio

Proprits du tSybaseBulkExec

Port Database

Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Server Bcp Utility Batch size Table Adresse IP du serveur de base de donnes pour la connexion de lutilitaire Bcp. Nom de lutilitaire bcp utiliser pour copier les donnes sur le serveur Sybase. Nombre de lignes dans chaque lot de traitement de donnes. Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration sur la table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Use an interface file Cochez cette case afin de spcifier un fichier interface dans le champ Interface file.

Action on table

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes, afin de supporter des caractres spcifiques. Exemple : CHARSET=KANJISIS_OS pour supporter les caractres japonais. Action on data Vous pouvez effectuer les actions suivantes sur la table dfinie :

Guide de Rfrence des Composants Talend Open Studio

859

Scnarios associs

Bulk Insert : ajoute des entres multiples la table. Le Job sarrte lorsque des doublons sont trouvs. Bulk Update : effectue des changements simultans aux multiples entres. Field Terminator Row Terminator Head row Encoding Caractre, chane ou expression rgulire sparant les champs. Chane (ex : \n sous Unix) sparant les lignes. Nombre de lignes den-tte ignorer en dbut de fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Slectionnez la sortie utiliser pour rcuprer la sortie standard de la base Sybase : to console : vers la console. to global variable : vers la variable globale. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du Job , ainsi quau niveau du composant.

Output

Ce composant est gnralement utilis lorsque les donnes charger dans la base nexigent aucune transformation particulire. Contrairement au composant Oracle ddi, ce composant Sybase ne permet aucune action directe sur les donnes.

Scnarios associs
Pour un scnario associ au composant tSybaseBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

860

Guide de Rfrence des Composants Talend Open Studio

tSybaseClose

tSybaseClose

Proprits du tSybaseClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Sybase Le composant tSybaseClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Sybase. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tSybaseConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tSybaseConnection et tSybaseRollback. Il est gnralement utilis avec un composant tSybaseConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tSybaseClose, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

861

tSybaseCommit

tSybaseCommit

Proprits du tSybaseCommit
Ce composant est troitement li aux composants tSybaseConnection et tSybaseRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Sybase Le composant tSybaseCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close Connection Slectionnez le composant tSybaseCommit dans la liste sil y a plus dune connexion dans votre Job. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tSybaseCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Sybase, notamment les composants tSybaseConnection et tSybaseRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tSybaseConnection et tSybaseRollback. Ils sont gnralement utiliss avec un composant tSybaseConnection car celui-ci permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tSybaseCommit, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

862

Guide de Rfrence des Composants Talend Open Studio

tSybaseConnection

tSybaseConnection

Proprits du tSybaseConnection
Ce composant est troitement li aux composants tSybaseCommit et tSybaseRollback. Ils sont gnralement utiliss avec un composant tSybaseConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Sybase Le composant tSybaseConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier une fois quil est valid en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Table Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Utilisation Limitation Ce composant est gnralement utilis avec des composants Sybase, notamment les composants tSybaseCommit et tSybaseRollback. n/a

Scnarios associs
Pour un scnario associ au composant tSybaseConnection, consultez la section intitule Scnario : Insrer des donnes dans des tables mre/fille .

Guide de Rfrence des Composants Talend Open Studio

863

tSybaseInput

tSybaseInput

Proprits du tSybaseInput
Famille de composant Fonction Objectif Databases/Sybase Le composant tSybaseInput lit une base de donnes et en extrait des champs laide de requtes. Le tSybaseInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio . Use an existing connec- Cochez cette case et slectionnez le composant tSybasetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

Basic settings

864

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

miques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Server Port Database Sybase Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma Sybase.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement :Guide utilisateur de Talend Open Studio. Table Name Query type et Query Nom de la table lire. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Sybase.

Scnario associ
Pour un scnario associ, consultez les scnarios du composant tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du tContextLoad.

Guide de Rfrence des Composants Talend Open Studio

865

tSybaseIQBulkExec

tSybaseIQBulkExec

Proprits du tSybaseIQBulkExec
Famille de composant Fonction Objectif Basic settings Databases/SybaseIQ Le composant tSybaseIQBulkExec permet de charger un fichier bulk dans une base de donnes Sybase IQ. Le tSybaseIQBulkExec est un composant ddi, il permet un gain de performance lors du traitement des donnes de la base de donnes Sybase IQ. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tSybasetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. DB Version Host Port Database Slectionnez la version de Sybase que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes.

866

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Table

Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration sur la table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback.

Action on table

Local filename

Nom du fichier traiter. Voir galement : Guide utilisateur de Talend Open Studio.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Advanced settings Lines terminated by Field Terminated by Use enclosed quotes Use fixed length tStatCatcher Statistics Utilisation Limitation Caractre, chane ou expression rgulire sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour utiliser des caractres pour entourer les donnes. Cochez cette case pour dterminer une longueur fixe pour les lignes de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes Sybase IQ. Contrairement au composant Oracle ddi bulk, il nest possible deffectuer aucune action sur les donnes avec ce composant ddi Sybase IQ.

Scnario associ
Pour un scnario associ au tSybaseIQBulkExec, consultez :

Guide de Rfrence des Composants Talend Open Studio

867

Scnario associ

la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

868

Guide de Rfrence des Composants Talend Open Studio

tSybaseIQOutputBulkExec

tSybaseIQOutputBulkExec

Proprits du tSybaseIQOutputBulkExec
Famille de composant Fonction Objectif Basic settings Databases/SybaseIQ Le tSybaseIQOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tSybaseIQOutputBulkExec est un composant ddi, il permet un gain de performance lors du traitement des donnes de la base de donnes Sybase IQ. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tSybasetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes.

Guide de Rfrence des Composants Talend Open Studio

869

Proprits du tSybaseIQOutputBulkExec

Table

Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration sur la table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table.

Action on table

File Name

Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio.

Append the file

Cochez cette case pour ajouter des lignes la fin des enregistrements.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Fields terminated by Lines terminated by Use enclose quotes Include Head Encoding Caractre, chane ou expression rgulire sparant les champs. Caractre, chane ou expression rgulire sparant les lignes. Cochez cette case pour utiliser des caractres pour entourer les donnes. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Usage Limitation

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

870

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Scnarios associs
Pour un scnario associ au composant tSybaseIQOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

871

tSybaseOutput

tSybaseOutput

tSybaseOutput Properties
Famille de composant Fonction Objectif Basic settings Databases/Sybase Le composant tSybaseOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tSybaseOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant tSybasetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

872

Guide de Rfrence des Composants Talend Open Studio

tSybaseOutput Properties

miques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Server Port Database Sybase Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma Sybase.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : Default : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Turn on identity insert Cochez cette case pour utiliser votre propre squence sur les valeurs Identity des donnes insres (plutt que de laisser le serveur SQL choisir les valeurs squentielles). Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls pri-

Action on table

Action on data

Guide de Rfrence des Composants Talend Open Studio

873

tSybaseOutput Properties

maires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tSybaseOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Use Batch size Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Cochez cette case afin dactiver le mode batch pour le traitement des donnes. Dans le champ Batch Size qui apparat, vous pouvez saisir le nombre de lignes par lot charger.

Advanced settings

Commit every

Additional Columns

874

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Cette case est disponible uniquement si vous avez choisi loption Insert, Update, Single Insert Query ou Delete dans le champ Action on data. tStat Catcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Utilisation Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Sybase. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnario associ
Pour un scnario associ au composant tSybaseOutput, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

875

tSybaseOutputBulk

tSybaseOutputBulk

Proprits du tSybaseOutputBulk
Les composants tSybaseOutputBulk et tSybaseBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tSybaseOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Sybase Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards Sybase. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes Sybase. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Include header Encoding Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

876

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec le composant tSybaseBulkExec. Ensemble ils offrent un gain de performance important pour lalimentation dune base de donnes Sybase.

Scnario associ
Pour un scnario associ au composant tSybaseOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

Guide de Rfrence des Composants Talend Open Studio

877

tSybaseOutputBulkExec

tSybaseOutputBulkExec

Proprits du tSybaseOutputBulkExec
Les composants tSybaseOutputBulk et tSybaseBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tSybaseOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/Sybase Le tSybaseOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tSybaseOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Sybase. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tSybasetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Server Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

878

Guide de Rfrence des Composants Talend Open Studio

Proprits du tSybaseOutputBulkExec

Username et Password Informations dauthentification de lutilisateur de base de donnes. Bcp Utility Table Nom de lutilitaire bcp utiliser pour copier les donnes sur le serveur Sybase. Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dInsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Action on table

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Use an interface file Cochez cette case afin de spcifier un fichier interface dans le champ Interface file.

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes, afin de supporter des caractres spcifiques. Exemple : CHARSET=KANJISIS_OS pour supporter les caractres japonais. Action on data Vous pouvez effectuer les actions suivantes sur la table dfinie : Bulk Insert : ajoute des entres multiples la table. Le Job sarrte lorsque des doublons sont trouvs. Bulk Update : effectue des changements simultans aux multiples entres. Field Terminator Caractre, chane ou expression rgulire sparant les champs.

Guide de Rfrence des Composants Talend Open Studio

879

Scnarios associs

DB Row Terminator First row N0 . Of File FILE Row Terminator Include Head Encoding

Chane (ex : \n sous Unix) sparant les lignes dans la base de donnes. Nombre de lignes den-tte ignorer en dbut de fichier. Caractre, chane ou expression rgulire sparant les lignes dans le fichier. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. to console : linformation est charge. to global variable : valeurs retournes partir de fichiers de log.

Output

tStatCatcher Statistics Utilisation Limitation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

Scnarios associs
Pour un scnario associ au composant tSybaseOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du tOracleBulkExec.

880

Guide de Rfrence des Composants Talend Open Studio

tSybaseRollback

tSybaseRollback

Proprits du tSybaseRollback
Ce composant est troitement li aux composants tSybaseCommit et tSybaseConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/Sybase Le tSybaseRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tSybaseConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants Sybase, notamment les composants tSybaseConnection et tSybaseCommit. n/a

Scnario associ
Pour un scnario associ au composant tSybaseRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

Guide de Rfrence des Composants Talend Open Studio

881

tSybaseRow

tSybaseRow

Proprits du tSybaseRow
Famille de composant Fonction Databases/Sybase Le tSybaseRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tSybaseRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tSytion baseConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Server Port Database Sybase schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma Sybase.

Objectif

Basic settings

882

Guide de Rfrence des Composants Talend Open Studio

Proprits du tSybaseRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table name Turn on identity insert Nom de la table lire. Cochez cette case pour utiliser votre propre squence sur les valeurs Identity des donnes insres (plutt que de laisser le serveur SQL choisir les valeurs squentielles). Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma.

Query type

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Advanced settings

Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre.

Guide de Rfrence des Composants Talend Open Studio

883

Scnario associ

Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnario associ
Pour un scnario associ au composant tSybaseRow, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du tMySQLRow.

884

Guide de Rfrence des Composants Talend Open Studio

tSybaseSCD

tSybaseSCD

Le composant tSybaseSCD appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tSybaseSCD .

Guide de Rfrence des Composants Talend Open Studio

885

tSybaseSCDELT

tSybaseSCDELT

Le composant tSybaseSCDELT appartient deux familles diffrentes : Business Intelligence et Databases. Pour plus dinformations, consultez la section intitule tSybaseSCDELT .

886

Guide de Rfrence des Composants Talend Open Studio

tSybaseSP

tSybaseSP

Proprits du tSybaseSP
Famille de composant Fonction Objectif Basic settings Databases/Sybase Le composant tSybaseSP appelle une procdure stocke de base de donnes. Ce composant permet de centraliser des requtes multiples ou complexes dans une base de donnes et de les appeler plus facilement. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier des proprits du composant. Les champs suivants sont alors pr-remplis. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tSytion baseConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository.

Guide de Rfrence des Composants Talend Open Studio

887

Scnario associ

Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. SP Name Saisissez le nom exact de la Procdure Stocke (SP). Is Function / Return re- Cochez cette case, si une seule valeur doit tre retourne. sult in Slectionnez dans la liste la colonne du schma sur laquelle est base la valeur obtenir. Timeout Interval Parameters Dure maximale dattente des rsultats de la procdure stocke. Cliquez sur le bouton [+] et slectionnez dans le champ Schema Columns les diffrentes colonnes ncessaires la procdure. Notez que le schma de la SP peut contenir plus de colonnes quil ny a de paramtres utiliss dans la procdure. Slectionnez le Type de paramtre : IN : paramtre dentre (Input) OUT : paramtre de sortie (Output)/valeur retourne IN OUT : les paramtres dentre doivent tre retournes sous forme de valeur, mme aprs modifications via la procdure (fonction). RECORDSET : les paramtres dentre doivent tre retournes sous forme densemble de valeurs, au lieu dune valeur unique. Consultez la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL. Advanced settings Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Use Multiple SELECT Cochez cette case pour utiliser des procdures contenant Procedure plusieurs instructions SELECT. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut. Dans ce cas, seuls les paramtres dentre sont autoriss. La syntaxe de la Procdure Stocke doit correspondre celle de la base de donnes.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Excuter une procdure stocke dans le hub MDM du composant tMysqlSP.

888

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Consultez galement la section intitule tPostgresPlusClose si vous voulez analyser un ensemble denregistrements dune table de donnes ou dune requte SQL.

Guide de Rfrence des Composants Talend Open Studio

889

tTeradataClose

tTeradataClose

Proprits du tTeradataClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Teradata Le composant tTeradataClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Teradata. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tTeradataConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tTeradataConnection et tTeradataRollback. Il est gnralement utilis avec un composant tTeradataConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tTeradataClose, consultez la section intitule tMysqlConnection

890

Guide de Rfrence des Composants Talend Open Studio

tTeradataCommit

tTeradataCommit

Proprits du tTeradataCommit
Ce composant est troitement li aux composants tTeradataConnection et tTeradataRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Teradata Le composant tTeradataCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Slectionnez le composant tTeradataConnection dans la liste sil y a plus dune connexion dans votre Job. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tTeradataCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Teradata, notamment les composants tTeradataConnection et tTeradataRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tTeradataConnection et tTeradataRollback. Ils sont gnralement utiliss avec un composant tTeradataConnection car celui-ci permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tTeradataCommit, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

891

tTeradataConnection

tTeradataConnection

Proprits du tTeradataConnection
Ce composant est troitement li aux composants tTeradataCommit et tTeradataRollback. Ils sont gnralement utiliss avec un composant tTeradataConnection car il permet douvrir une connexion pour la transaction en cours. Famille de composant Fonction Objectif Basic settings Databases/Teradata Le composant tTeradataConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Database Adresse IP du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes, afin de supporter des caractres spcifiques. Exemple : CHARSET=KANJISIS_OS pour supporter les caractres japonais. Dans ce champ, vous pouvez paramtrer le type dencodage. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto Commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant est gnralement utilis avec des composants Teradata, notamment les composants tTeradataCommit et tTeradataRollback.

892

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Limitation

n/a

Scnario associ
Ce composant est troitement li aux composants tTeradataCommit et tTeradataRollback. Ils sont gnralement utiliss avec un composant tTeradataConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tTeradataConnection, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

893

tTeradataFastExport

tTeradataFastExport

Proprits du tTeradataFastExport
Famille de composant Fonction Objectif Basic settings Databases/Teradata Le composant tTeradataFastExport exporte trs rapidement des lots de donnes volumineux dune table ou dune vue Teradata. Le tTeradataFastExport exporte des lots de donnes dune table Teradata vers un systme client ou vers une base de donnes plus petite. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Execution platform Host Database name Slectionnez le type de systme dexploitation que vous utilisez. Adresse IP du serveur de base de donnes Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Use query Log database Log table Cochez cette case afin de saisir l'instruction SQL dans le champ Query. Nom de la base de donnes de log. Nom de la table de log.

Script generated folder Parcourez votre rpertoire et slectionnez la destination du fichier qui sera cr. Exported file Field separator Error file Nom et chemin daccs au fichier qui sera cr. Caractre, chane ou expression rgulire sparant les champs. Parcourez votre rpertoire et slectionnez la destination du fichier dans lesquels seront enregistrs les messages derreur.

894

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Advanced settings Utilisation

tStat Catcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Teradata.

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

895

tTeradataFastLoad

tTeradataFastLoad

Proprits du tTeradataFastLoad
Famille de composant Fonction Objectif Databases/Teradata Le composant tTeradataFastLoad lit une base de donnes et en extrait des champs laide de requtes. Le tTeradataFastLoad excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Database Adresse IP du serveur de base de donnes. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Execute Batch every Die on error Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Nombre de lignes par lot charger. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Teradata.

896

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

897

tTeradataFastLoadUtility

tTeradataFastLoadUtility

Proprits du tTeradataFastLoadUtility
Famille de composant Fonction Objectif Databases/Teradata Le composant tTeradataFastLoadUtility lit une base de donnes et en extrait des champs laide de requtes. Le tTeradataFastLoadUtility excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Execution platform Database name Slectionnez le type de systme dexploitation que vous utilisez. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Script generated folder Parcourez votre rpertoire et slectionnez la destination du fichier qui sera cr. Load file Field separator Error file Entrez le nom du fichier partir duquel vous souhaitez charger les donnes. Caractre, chane ou expression rgulire sparant les champs. Parcourez votre rpertoire et slectionnez la destination du fichier dans lesquels seront enregistrs les messages derreur. Spcifiez lencodage des caractres dont vous avez besoin pour utiliser votre systme.

Advanced settings

Define character set

898

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Check point Error files

Saisissez la valeur du point de validation. Saisissez le nom du fichier dans lequel les messages derreur sont stocks. Par dfaut, le code saisi est ERRORFILES table_ERR1, ce qui signifie que les deux tables table_ERR1 et table_ERR2 sont utilises pour enregistrer les messages derreur. Cochez cette case pour spcifier le code de retour partir duquel retourner une erreur dans la console. Saisissez le nombre limite derreurs dtectes durant la phase de chargement. Le processus sarrte lorsque la limite est atteinte. Par dfaut, la valeur limite derreurs est de 1000000. Pour plus dinformations, consultez la documentation Teradata FastLoad Reference.

Return fastload error ERRLIMIT

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Teradata.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Insrer des donnes dans une table dune base de donnes Teradata .

Guide de Rfrence des Composants Talend Open Studio

899

tTeradataInput

tTeradataInput

Proprits du tTeradataInput
Famille de composant Fonction Objectif Databases/Teradata Le composant tTeradataInput lit une base de donnes et en extrait des champs laide de requtes. Le tTeradataInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tTeradation taConnection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant.

Basic settings

900

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Query type et Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes, afin de supporter des caractres spcifiques. Exemple : CHARSET=KANJISIS_OS pour supporter les caractres japonais. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Cochez cette case pour supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Teradata.

Scnario associ
Pour un scnario associ, consultez les scnarios du composant gnrique tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du tContextLoad.

Guide de Rfrence des Composants Talend Open Studio

901

tTeradataMultiLoad

tTeradataMultiLoad

Proprits du tTeradataMultiLoad
Famille de composant Fonction Objectif Databases/Teradata Le composant tTeradataMultiLoad lit une base de donnes et en extrait des champs laide de requtes. Le tTeradataMultiLoad excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Execution platform Database name Slectionnez le type de systme dexploitation que vous utilisez. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Script generated folder Parcourez votre rpertoire et slectionnez la destination du fichier qui sera cr. Action to data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes.

902

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une cl de recherche sur laquelle baser les oprations Update et Delete. Il est possible de dfinir les colonnes qui agiront comme cl de recherche partir du schma, pour une utilisation de base, ou partir des options avances ( Advanced settings ) pour une utilisation optimise de ces oprations. Where condition in case Saisissez une condition, qui, si elle est vrifie, supprimera Delete la ligne. Load file Field separator Error file Entrez le nom du fichier partir duquel vous souhaitez charger les donnes. Caractre, chane ou expression rgulire sparant les champs. Parcourez votre rpertoire et slectionnez la destination du fichier dans lesquels seront enregistrs les messages derreur. Cochez cette case pour dfinir la table de log que vous souhaitez utiliser au lieu de celle par dfaut, savoir celle que vous avez dfinie dans longlet Basic settings. La syntaxe requise pour dfinir la table de log est databasename.logtablename. Ce champ vous permet de dfinir votre commande BEGIN LOAD pour lancer ou relancer une tche TPump. Vous pouvez spcifiez le nombre de sessions utiliser, la limite derreurs, ainsi que tout autre paramtre ncessaire lexcution de la tche. Pour plus dinformations, consultez la documentation Teradata MultiLoad Reference. Return mload error Define character set tStatCatcher Statistics Utilisation Cochez cette case pour spcifier le code de retour partir duquel retourner une erreur dans la console. Spcifiez lencodage des caractres dont vous avez besoin pour utiliser votre systme. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Define Log table

BEGIN LOAD

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Teradata.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Insrer des donnes dans une table dune base de donnes Teradata .

Guide de Rfrence des Composants Talend Open Studio

903

tTeradataOutput

tTeradataOutput

Proprits du tTeradataOutput
Famille de composant Fonction Objectif Basic settings Databases/Teradata Le composant tTeradataOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tTeradataOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tTeradation taConnection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant.

904

Guide de Rfrence des Composants Talend Open Studio

Proprits du tTeradataOutput

Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Truncate table : supprimer rapidement le contenu de la table, mais sans possibilit de Rollback. Create Elle n'est pas visible par dfaut, sauf si vous choisissez de crer une table partir de la liste droulante Action on table. La table crer peut tre : -SET TABLE: table ne permettant pas de dupliquer les lignes -MULTI SET TABLE : table permettant de dupliquer les lignes. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspon-

Guide de Rfrence des Composants Talend Open Studio

905

Proprits du tTeradataOutput

dant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete). Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes, afin de supporter des caractres spcifiques. Exemple : CHARSET=KANJISIS_OS pour supporter les caractres japonais. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Vous pouvez appuyer sur Ctrl+Espace afin daccder une liste de variables globales prdfinies. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes.

Additional Columns

906

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tTeradataOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Use Batch Size Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes. Nombre de lignes dans chaque lot de traitement de donnes.

tStat Catcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Utilisation Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Teradata. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnario associ
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMysqlOutput.

Guide de Rfrence des Composants Talend Open Studio

907

tTeradataRollback

tTeradataRollback

Proprits du tTeradataRollback
Ce composant est troitement li aux composants tTeradataCommit et tTeradataConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/Teradata Le tTeradataRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tTeradataConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants Teradata, notamment les composants tTeradataConnection et tTeradataCommit. n/a

Scnario associ
Pour un scnario associ au composant tTeradataRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

908

Guide de Rfrence des Composants Talend Open Studio

tTeradataRow

tTeradataRow

Proprits du tTeradataRow
Famille de composant Fonction Databases/Teradata Le tTeradataRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tTeradataRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tTeradation taConnection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

909

Proprits du tTeradataRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Additional JDBC para- Ajoutez des informations de connexion supplmentaires meters ncessaires la connexion la base de donnes, afin de supporter des caractres spcifiques. Exemple : CHARSET=KANJISIS_OS pour supporter les caractres japonais. Cette option est disponible lorsque la case Use an existing connection est dcoche dans les Basic settings. Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance.

910

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Commit every

Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnario associ
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

911

tTeradataTPump

tTeradataTPump

Proprits du tTeradataTPump
Famille de composant Fonction Objectif Databases/Teradata Le composant tTeradataTPump lit une base de donnes et en extrait des champs l'aide de requtes. Le tTeradataTPump excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Execution platform Database name Slectionnez le type de systme dexploitation que vous utilisez. Nom de la base de donnes.

Basic settings

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crer. Vous ne pouvez crer quune seule table la fois.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Script generated folder Parcourez votre rpertoire et slectionnez la destination du fichier qui sera cr. Action to data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Delete : Supprimer les entres correspondantes au flux dentre.

912

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes dans une table dune base de donnes Teradata

Il est ncessaire de spcifier au minimum une cl de recherche sur laquelle baser les oprations Update et Delete. Il est possible de dfinir les colonnes qui agiront comme cl de recherche partir du schma, pour une utilisation de base, ou partir des options avances (Advanced settings) pour une utilisation optimise de ces oprations. Where condition in case Saisissez une condition, qui, si elle est vrifie, supprimera Delete la ligne. Load file Field separator Error file Entrez le nom du fichier partir duquel vous souhaitez charger les donnes. Caractre, chane ou expression rgulire sparant les champs. Parcourez votre rpertoire et slectionnez la destination du fichier dans lesquels seront enregistrs les messages derreur. Cochez cette case pour dfinir la table de log que vous souhaitez utiliser au lieu de celle par dfaut, savoir celle que vous avez dfinie dans longlet Basic settings. La syntaxe requise pour dfinir la table de log est databasename.logtablename. Ce champ vous permet de dfinir votre commande BEGIN LOAD pour lancer ou relancer une tche TPump. Vous pouvez spcifiez le nombre de sessions utiliser, la limite derreurs, ainsi que tout autre paramtre ncessaire lexcution de la tche. La valeur par dfaut est : SESSIONS 8 PACK 600 ARRAYSUPPORT ON CHECKPOINT 60 TENACITY 2 ERRLIMIT 1000. Pour plus dinformations, consultez la documentation Teradata Parallel Data Pump Reference. Return tpump error Define character set tStatCatcher Statistics Utilisation Cochez cette case pour spcifier le code de retour partir duquel retourner une erreur dans la console. Spcifiez lencodage des caractres dont vous avez besoin pour utiliser votre systme. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Define Log table

BEGIN LOAD

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Teradata.

Scnario : Insrer des donnes dans une table dune base de donnes Teradata
Dans ce scnario, lobjectif est de crer un Job utilisant le composant tTeradataTPump pour insrer des donnes clients dans une table dune base de donnes Teradata et retourner la valeur de retour lorsquune erreur se produit. Trois composants sont utiliss pour implmenter cette tche : tRowGenerator : gnre autant de lignes que ncessaire, en utilisant au hasard des donnes clients prises dans une liste.

Guide de Rfrence des Composants Talend Open Studio

913

Scnario : Insrer des donnes dans une table dune base de donnes Teradata

tFileOutputDelimited : crit les donnes clients dans un fichier dlimit. tTeradataTPump : insre les donnes clients dans la table de la base de donnes Teradata en mode Tpump.

Dposez les composants suivants de la Palette dans lespace de modlisation graphique : tRowGenerator, tFileOutputDelimited, tTeradataTPump. Liez le tRowGenerator au tFileOutputDelimited laide dun lien Row > Main. Liez le tRowGenerator au tTeradataTPump laide dun lien Trigger > OnSubjobOk. Double-cliquez sur le tRowGenerator pour ouvrir la fentre RowGenerator Editor. Dans la fentre tRowGenerator Editor, dfinissez les donnes gnrer. Pour ce Job, le schma se compose de deux colonnes : ID et Name.

Dans le champ Number of Rows for RowGenerator, saisissez le nombre de lignes gnrer, 100 dans cet exemple. Double-cliquez sur le tFileOutputDelimited afin dafficher sa vue Component et dfinir ses proprits. A ct du champ File Name, parcourez votre rpertoire jusquau fichier de sortie, ou saisissez un nom pour le fichier crer. Entre guillemets doubles, saisissez les sparateurs utiliser, ct des champs Row Separator et Field Separator, par exemple \n et un point-virgule.

914

Guide de Rfrence des Composants Talend Open Studio

Scnario : Insrer des donnes dans une table dune base de donnes Teradata

Cliquez sur Edit schema et vrifiez que le schma est retrouv partir du schma dentre. Au besoin, cliquez sur Sync Columns. Double-cliquez sur le composant tTeradataTPump afin douvrir sa vue Component. Dans longlet Basic settings de la vue Component, dfinissez les paramtres du composant tTeradataTPump.

Saisissez le nom de la base de donnes dans le champ Database name, votre identifiant de connexion la base de donnes dans le champ User name, et votre mot de passe dans le champ Password. Spcifiez la table dans laquelle insrer les donnes clients. Dans ce scnario, la table est mytable. Dans les champs Script generated folder, Load file et Error file, spcifiez le rpertoire respectivement au dossier dans lequel vous stockez les fichiers de scripts gnrs. Dans le champ Load File, spcifiez le fichier contenant les donnes clients insrer. Dans le champ Error file, spcifiez le fichier contenant les informations concernant les erreurs. Dans le champ Action on data, slectionnez loption Insert. Appuyez sur F6 pour excuter le Job.

Guide de Rfrence des Composants Talend Open Studio

915

Scnario : Insrer des donnes dans une table dune base de donnes Teradata

La console de la vue Run saffiche ainsi :

Double-cliquez sur le composant tTeradataTPump pour retourner sa vue Component. Dans longlet Advanced settings, cochez la case Return tpump error et saisissez le code de retour partir duquel retourner une erreur dans la console. Dans cet exemple, saisissez le chiffre 4 et utilisez les valeurs par dfaut pour les autres paramtres.

Appuyez sur F6 pour excuter le Job. La console de la vue Run saffiche ainsi :

Une erreur se produit et le TPump retourne le code de retour, de 12. Si vous avez besoin dinformations dtailles concernant les informations dtailles de lerreur, vous pouvez ouvrir le fichier de log stock dans le rpertoire spcifi dans le champ Error file et dans longlet Basic settings de la vue Component.

916

Guide de Rfrence des Composants Talend Open Studio

tVectorWiseCommit

tVectorWiseCommit

Proprits du tVectorWiseCommit
Ce composant est troitement li aux composants tVectorWiseConnection et tVectorWiseRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/VectorWise Le composant tVectorWiseCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tVectorWiseConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tVectorWiseCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Close connection

Ce composant est gnralement utilis avec des composants VectorWise et notamment avec les composants tVectorWiseConnection et tVectorWiseRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tVectorWiseConnection et tVectorWiseRollback. Ils sont gnralement utiliss avec un composant tVectorWiseConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tVectorWiseCommit, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

917

tVectorWiseConnection

tVectorWiseConnection

Proprits du tVectorWiseConnection
Ce composant est troitement li aux composants tVectorWiseCommit et tVectorWiseRollback. Ils sont gnralement utiliss avec un composant tVectorWiseConnection car il permet douvrir une connexion pour la transaction en cours.

Famille de composant Fonction Objectif Basic settings

Databases/VectorWise Le composant tVectorWiseConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Server Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Auto Commit Cochez cette case pour que, lorsquune dclaration est termine, la mthode commit soit appele automatiquement sur cette dclaration. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis avec des composants VectorWise, notamment les composants tVectorWiseCommit et tVectorWiseRollback. n/a

918

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Scnario associ
Ce composant est troitement li aux composants tVectorWiseCommit et tVectorWiseRollback. Ils sont gnralement utiliss avec un composant tVectorWiseConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tVectorWiseConnection, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

919

tVectorWiseInput

tVectorWiseInput

Proprits du tVectorWiseInput
Famille de composant Fonction Objectif Databases/VectorWise Le composant tVectorWiseInput lit une base de donnes et en extrait des champs laide de requtes. Le tVectorWiseInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide Utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant tVectortion WiseConnection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

Basic settings

920

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

miques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Server Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. Table name Query type et Query Saisissez le nom de la table. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Cliquez sur le bouton pour rcuprer le schma de la table.

Guess Query

Guess schema Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column Dans la colonne Column, saisissez le nom de la colonne dans laquelle supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes VectorWise.

Scnario associ
Pour un scnario associ, consultez les scnarios du composant gnrique tDBInput : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery Consultez galement la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL du tContextLoad.

Guide de Rfrence des Composants Talend Open Studio

921

tVectorWiseOutput

tVectorWiseOutput

Proprits du tVectorWiseOutput
Famille de composant Fonction Objectif Basic settings Databases/VectorWise Le composant tVectorWiseOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tVectorWiseOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant tVectortion WiseConnection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

922

Guide de Rfrence des Composants Talend Open Studio

Proprits du tVectorWiseOutput

miques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme manire avec les cases Key in delete pour les oprations de suppression (Delete).

Guide de Rfrence des Composants Talend Open Studio

923

Proprits du tVectorWiseOutput

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tTeradataOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus de dcriture dans la base de donnes.

Advanced settings

Commit every

Additional Columns

Support null in SQL Cochez cette case pour prendre en compte les valeurs Null WHERE statement dune table de base de donnes. Assurez-vous que la case Nullable est bien coche pour les colonnes du schma correspondantes. tStat Catcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Utilisation Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes VectorWise. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour

924

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

Scnario associ
Pour un scnario associ, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMySQLOutput.

Guide de Rfrence des Composants Talend Open Studio

925

tVectorWiseRollback

tVectorWiseRollback

Proprits du tVectorWiseRollback
Ce composant est troitement li aux composants tVectorWiseCommit et tVectorWiseConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/VectorWise Le tVectorWiseRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tVectorWiseConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants VectorWise, notamment les composants tVectorWiseConnection et tVectorWiseCommit. n/a

Scnario associ
Pour un scnario associ au composant tVectorWiseRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

926

Guide de Rfrence des Composants Talend Open Studio

tVectorWiseRow

tVectorWiseRow

Proprits du tVectorWiseRow
Famille de composant Fonction Databases/VectorWise Le tVectorWiseRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tVectorWiseRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez cette case et slectionnez le composant tVectortion WiseConnection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinis. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

927

Proprits du tVectorWiseRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type Nom de la table traiter. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Guess Query Cliquez sur le bouton Guess Query pour gnrer la requte correspondant au schma de votre table dans le champ Query. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Query

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de

928

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnario associ
Pour un scnario associ, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du composant tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du composant tMySQLRow.

Guide de Rfrence des Composants Talend Open Studio

929

tVerticaBulkExec

tVerticaBulkExec

Proprits du tVerticaBulkExec
Les composants tVerticaOutputBulk et tVerticaBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tVerticaOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le changement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Vertica Le composant tVerticaBulkExec effectue une action dInsert sur les donnes fournies. Le tVerticaBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Vertica. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Slectionnez dans la liste la version de Vertica que vous utilisez.

Use an existing connec- Cochez cette case lorsque vous utilisez un composant tion tVerticaConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Adresse IP du serveur de base de donnes

930

Guide de Rfrence des Composants Talend Open Studio

Proprits du tVerticaBulkExec

Port Database

Numro du port dcoute du serveur de base de donnes Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Action on table Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Table Nom de la table crire. Notez quune seule table peut tre crite la fois.

Schema et Edit schema Dans une procdure stocke, le schma est un paramtre dentre. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide Utilisateur de Talend Open Studio. Remote Filename Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Write to ROS (Read Op- Cochez cette case pour stocker les donnes dans une mtimized Store) moire physique, et ainsi optimiser la lecture de ces donnes, puisquelles seront compresses et pr-tries. Exit job if no row was Le Job sarrte automatiquement si aucune ligne na t loaded charge. Fields terminated by Null string tStatCatcher Statistics Utilisation Caractre, chane ou expression rgulire sparant les champs. Chane de caractres affiche pour signifier que la valeur est nulle. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec un composant tVerticaOutputBulk. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes Vertica.

Guide de Rfrence des Composants Talend Open Studio

931

Scnarios associs

Scnarios associs
Pour un scnario associ au composant tVerticaBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du composant tMysqlOutputBulkExec. la section intitule Scnario : Supprimer et insrer des donnes dans une base Oracle du composant tOracleBulkExec.

932

Guide de Rfrence des Composants Talend Open Studio

tVerticaClose

tVerticaClose

Proprits du tVerticaClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Databases/Vertica Le composant tVerticaClose ferme la connexion une base de donnes connecte. Ce composant permet de fermer une connexion la base de donnes Vertica. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tVerticaConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tVerticaConnection et tVerticaRollback. Il est gnralement utilis avec un composant tVerticaConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tVerticaClose, consultez la section intitule tMysqlConnection

Guide de Rfrence des Composants Talend Open Studio

933

tVerticaCommit

tVerticaCommit

Proprits du tVerticaCommit
Ce composant est troitement li aux composants tVerticaConnection et tVerticaRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Databases/Vertica Le composant tVerticaCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list Close connection Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tVerticaConnection dans la liste. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tVerticaCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Vertica et notamment avec les composants tVerticaConnection et tVerticaRollback. n/a

Scnario associ
Ce composant est troitement li aux composants tVerticaConnection et tVerticaRollback. Ils sont gnralement utiliss avec un composant tVerticaConnection car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tVerticaCommit, consultez la section intitule tMysqlConnection .

934

Guide de Rfrence des Composants Talend Open Studio

tVerticaConnection

tVerticaConnection

Proprits du tVerticaConnection
Ce composant est troitement li aux composants tVerticaCommit et tVerticaRollback. Ils sont gnralemet utiliss avec un composant tVerticaConnection car il permet douvrir une connexion pour la transaction en cours.

Famille de composant Fonction Objectif Basic settings

Databases/Vertica Le composant tVerticaConnection ouvre une connexion vers une base de donnes afin deffectuer une transaction. Ce composant permet de commiter les donnes dun Job entier en une seule transaction vers une base de donnes de sortie. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Host Port Database Table Schema Slectionnez dans la liste la version de Vertica que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom du schma.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Use or register a shared Cochez cette case pour partager votre connexion ou rcuDB Connection prer une connexion mise en partage dans un Job pre ou un Job fils. Cette option vous permet de partager une seule connexion une base de donnes dans plusieurs composants de connexion des bases de donnes, dans diffrents niveaux de Jobs, qui peuvent tre des Jobs parent ou enfant. Shared DB Connection Name : dfinissez ou saisissez le nom de la connexion partage. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec des composants Vertica, notamment les composants tVerticaCommit et tVerticaRollback. n/a

Guide de Rfrence des Composants Talend Open Studio

935

Scnario associ

Scnario associ
Ce composant est troitement li aux composants tVerticaCommit et tVerticaRollback. Ils sont gnralement utiliss avec un composant tVerticaConnection car il permet douvrir une connexion pour la transaction en cours. Pour un scnario associ au composant tVerticaConnection, consultez la section intitule tMysqlConnection

936

Guide de Rfrence des Composants Talend Open Studio

tVerticaInput

tVerticaInput

Proprits du tVerticaInput
Famille de composant Fonction Objectif Databases/Vertica Le composant tVerticaInput lit une base de donnes et en extrait des champs laide de requtes. Le tVerticaInput excute une requte en base de donnes selon un ordre strict qui doit correspondre celui dfini dans le schma. La liste des champs rcupre est ensuite transmise au composant suivant via une connexion de flux (Main row). Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio . DB Version Slectionnez dans la liste la version de Vertica que vous utilisez.

Basic settings

Use an existing connec- Cochez cette case lorsque vous utilisez le composant tVertion ticaConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

Guide de Rfrence des Composants Talend Open Studio

937

Scnarios associs

miques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository). Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table Name Query type et Query Nom de la table lire. Saisissez votre requte de base de donnes en faisant attention ce que lordre des champs corresponde celui dfini dans le schma.

Advanced settings

Trim all the String/Char Cochez cette case pour supprimer les espaces en dbut et columns en fin de champ dans toutes les colonnes contenant des chanes de caractres. Trim column tStatCatcher Statistics Supprimez les espaces en dbut et en fin de champ dans les colonnes slectionnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisation

Ce composant couvre toutes les possibilits de requte SQL dans les bases de donnes Vertica.

Scnarios associs
Voir galement les scnarios du tDBInput dans : la section intitule Scnario 1 : Afficher les donnes slectionnes partir dune table . la section intitule Scnario 2 : Utiliser la variable StoreSQLQuery . Voir galement le scnario du tContextLoad,, consultez la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL .

938

Guide de Rfrence des Composants Talend Open Studio

tVerticaOutput

tVerticaOutput

Proprits du tVerticaOutput
Famille de composant Fonction Objectif Basic settings Databases/Vertica Le composant tVerticaOutput crit, met jour, modifie ou supprime les donnes dune base de donnes. Le tVerticaOutput excute laction dfinie sur la table et/ou sur les donnes dune table, en fonction du flux entrant provenant du composant prcdent. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de configuration de connexion la base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. DB Version Slectionnez dans la liste la version de Vertica que vous utilisez.

Use an existing connec- Cochez cette case lorsque vous utilisez le composant tVertion ticaConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dyna-

Guide de Rfrence des Composants Talend Open Studio

939

Proprits du tVerticaOutput

miques (Dynamic settings), consultez le Guide utilisateur de votre Studio. Host Port Database Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes Table Action on table Nom de la table crer. Vous ne pouvez crer quune seule table la fois. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : Default : neffectuer aucune opration de table. Drop and create table : supprimer la table puis en crer une nouvelle. Create table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Drop table if exists and create : supprimer la table si elle existe dj, puis en crer une nouvelle. Clear table : supprimer le contenu de la table. Action on data Vous pouvez effectuer les oprations suivantes sur les donnes de la table slectionne : Insert : Ajouter de nouvelles entres la table. Le Job sarrte lorsquil dtecte des doublons. Update : Mettre jour les entres existantes. Insert or update : Ajouter des entres ou mettre jour les entres existantes. Update or insert : Mettre jour les entres existantes ou en crer si elles nexistent pas. Delete : Supprimer les entres correspondantes au flux dentre. Il est ncessaire de spcifier au minimum une colonne comme cl primaire sur laquelle baser les oprations Update et Delete . Pour cela, cliquez sur le bouton [...] ct du champ Edit Schema et cochez la ou les case(s) correspondant la ou aux colonne(s) que vous souhaitez dfinir comme cl(s) primaire(s). Pour une utilisation avance, cliquez sur longlet Advanced settings pour dfinir simultanment les cls primaires sur lesquelles baser les oprations de mise jour (Update) et de suppression (Delete). Pour cela, cochez la case Use field options et slectionnez la case Key in update correspondant la colonne sur laquelle baser votre opration de mise jour (Update). Procdez de la mme ma-

940

Guide de Rfrence des Composants Talend Open Studio

Proprits du tVerticaOutput

nire avec les cases Key in delete pour les oprations de suppression (Delete). Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution. Cochez cette case afin darrter lopration de copie (Copy) sur les donnes si une ligne est rejete et annule cette opration. Ainsi, aucune donne nest traite.

Advanced settings

Commit every

Paramtres Copy Cette zone est uniquement disponible si vous avez choisi Copy dans la liste Action on data. Pour des informations plus dtailles concernant les paramtres Copy, consultez votre Manuel de Rfrence Vertica SQL.

Abort on error

Maximum rejects

Saisissez un nombre afin de configurer la commande REJECTMAX utilise par Vertica, qui indique la limite maximale du nombre denregistrements logiques rejeter avant quun chargement nchoue. Si ce nombre nest pas spcifi ou si sa valeur est 0, le nombre de rejets autoriss est illimit. Cochez cette case pour empcher lopration actuelle de commiter automatiquement. Saisissez le chemin daccs, ou parcourez et slectionnez le fichier dans lequel sont crits les messages indiquant le nombre de lignes dentre et la raison de chaque rejet denregistrement de donnes. Indiquez quel est le nud du fichier dexception. Si ce champ nest pas renseign, le nud de linitiateur de la requte est choisi par dfaut. Saisissez le chemin daccs, ou parcourez et slectionnez le fichier dans lequel seront crites les lignes rejetes. Ce

No commit Exception file

Exception file node

Rejected data file

Guide de Rfrence des Composants Talend Open Studio

941

Proprits du tVerticaOutput

fichier pourra ensuite tre modifi afin de rsoudre des problmes, et pourra tre regnr. Rejected data file node Indiquez quel est le nud du fichier des donnes rejetes. Si ce champ nest pas renseign, le nud de linitiateur de la requte est choisi par dfaut. Use Batch mode Cochez cette case afin dactiver le mode batch pour le traitement des donnes. Dans le champ Batch Size qui apparat, vous pouvez saisir le nombre de lignes par lot charger. Cette case est disponible uniquement si vous avez choisi loption Insert, Update, Single Insert Query ou Delete dans le champ Action on data. Additional Columns Cette option nest pas disponible si vous venez de crer la table de donnes (que vous layez pralablement supprime ou non). Cette option vous permet deffectuer des actions sur les colonnes, lexclusion des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne modifier ou insrer. SQL expression : Saisissez la dclaration SQL excuter pour modifier ou insrer les donnes dans les colonnes correspondantes. Position : Slectionnez Before, Replace ou After, en fonction de laction effectuer sur la colonne de rfrence. Reference column : Saisissez une colonne de rfrence que le composant tVerticaOutput peut utiliser pour situer ou remplacer la nouvelle colonne ou celle modifier. Use field options Enable debug mode Cochez cette case pour personnaliser une requte, surtout lorsquil y a plusieurs actions sur les donnes. Cochez cette case pour afficher chaque tape du processus dcriture dans la base de donnes.

Support null in "SQL Cochez cette case afin d'autoriser les valeurs nulles dans WHERE" statement l'instruction "SQL WHERE". Create projection when Cochez cette case afin de crer une projection pour la table create table crer. Cette case est disponible uniquement lorsque vous avez slectionn l'option de cration de table dans la liste Action on table. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits des requtes SQL. Il permet de faire des actions sur une table ou les donnes dune table dune base de donnes Vertica. Il permet aussi de crer un flux de rejet avec un lien Row > Reject filtrant les donnes en erreur. Pour un exemple dutilisation, consultez la section intitule Scnario 3 : Rcuprer les donnes errones laide dun lien Reject du composant tMysqlOutput.

942

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Scnarios associs
Pour un scnario associ au composant tVerticaOutput, consultez : la section intitule Scnario : Afficher la base de donnes en sortie du composant tDBOutput. la section intitule Scnario 1 : Ajouter une colonne et modifier les donnes du composant tMySQLOutput.

Guide de Rfrence des Composants Talend Open Studio

943

tVerticaOutputBulk

tVerticaOutputBulk

Proprits du tVerticaOutputBulk
Les composants tVerticaOutputBulk et tVerticaBulkExec sont gnralement utiliss ensemble pour dune part gnrer en sortie le fichier qui sera dautre part utilis comme paramtre dans lexcution de la requte SQL nonce. Cette excution en deux tapes est unifie dans le composant tVerticaOutputBulkExec, dtaill dans une section spare. Lintrt de proposer deux composants spars rside dans le fait que cela permet de procder des transformations avant le chargement des donnes dans la base de donnes. Famille de composant Fonction Objectif Basic settings Databases/Vertica Ecrit un fichier compos de colonnes et bas sur le dlimiteur dfini et sur les standards Vertica. Prpare le fichier utiliser comme paramtre dans la requte INSERT servant alimenter une base de donnes Vertica. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio. Append Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide Utilisateur de Talend Open Studio. Advanced settings Row separator Field separator Include header Encoding Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

944

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec le composant tVerticaBulkExec. Ensemble, ils offrent un gain de performance important pour lalimentation dune base de donnes Vertica.

Scnarios associs
Pour un scnario associ au tVerticaOutputBulk, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

945

tVerticaOutputBulkExec

tVerticaOutputBulkExec

Proprits du tVerticaOutputBulkExec
Les composants tVerticaOutputBulk et tVerticaBulkExec sont gnralement utiliss ensemble comme deux parties dun processus en deux tapes. Dans la premire tape, un fichier de sortie est gnr. Dans la deuxime tape, ce fichier est utilis lors de lopration dINSERT afin de populer une base de donnes. Cette excution en deux tapes est unifie dans le composant tVerticaOutputBulkExec. Famille de composant Fonction Objectif Basic settings Databases/Vertica Le composant tVerticaOutputBulkExec effectue une action dInsert sur les donnes fournies. Le tVerticaOutputBulkExec est un composant ddi qui permet un gain de performance pendant les oprations dInsert dans une base de donnes Vertica. Property Type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB Version Host Port DB Name Slectionnez dans la liste la version de Vertica que vous utilisez. Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes.

Username et Password Informations dauthentification de lutilisateur de base de donnes. Table Nom de la table crire. Notez quune seule table peut tre crite la fois et la table doit dj exister pour que lopration dinsert soit autorise. Vous pouvez effectuer lune des oprations suivantes sur les donnes de la table slectionne : None : neffectuer aucune opration de table. Drop and create the table : supprimer la table puis en crer une nouvelle. Create a table : crer une table qui nexiste pas encore. Create table if doesnt exist : crer la table si ncessaire. Clear a table : supprimer le contenu de la table. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository.

Action on table

946

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement : Guide utilisateur de Talend Open Studio. File Name Nom du fichier traiter. Voir galement : Guide utilisateur de Talend Open Studio. Append Advanced settings Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Write to ROS (Read Op- Cochez cette case pour stocker les donnes dans une mtimized Store) moire physique, et ainsi optimiser la lecture de ces donnes, puisquelles seront compresses et pr-tries. Exit job if no row was Le Job sarrte automatiquement si aucune ligne na t loaded charge. Field Separator Null string Include header Encoding Caractre, chane ou expression rgulire sparant les champs. Chane de caractres affiche pour signifier que la valeur est nulle. Cochez cette case pour inclure len-tte des colonnes dans le fichier. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est principalement utilis lorsquaucune transformation particulire nest requise sur les donnes charger dans la base de donnes. n/a

Scnarios associs
Pour un scnario associ au tVerticaOutputBulkExec, consultez : la section intitule Scnario : Insrer des donnes transformes dans une base MySQL du composant tMysqlOutputBulk. la section intitule Scnario : Insrer des donnes dans une base MySQL du tMysqlOutputBulkExec.

Guide de Rfrence des Composants Talend Open Studio

947

tVerticaRollback

tVerticaRollback

Proprits du tVerticaRollback
Ce composant est troitement li aux composants tVerticaCommit et tVerticaConnection. Ils sont gnralement utiliss ensemble lors dune transaction. Famille de composant Fonction Objectif Basic settings Databases/Vertica Le tVerticaRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Component list Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez le composant tVerticaConnection dans la liste sil y a plus dune connexion dans votre Job. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis avec dautres composants Vertica, notamment les composants tVerticaConnection et tVerticaCommit. n/a

Scnario associ
Pour un scnario associ au composant tVerticaRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille .

948

Guide de Rfrence des Composants Talend Open Studio

tVerticaRow

tVerticaRow

Proprits du tVerticaRow
Famille de composant Fonction Databases/Vertica Le tVerticaRow est le composant spcifique ce type de base de donnes. Il excute des requtes SQL dclares sur la base de donnes spcifie. Le suffixe Row signifie que le composant met en place un flux dans le Job bien que ce composant ne produise pas de donnes en sortie. Selon la nature de la requte et de la base de donnes, tVerticaRow agit sur la structure mme de la base de donnes ou sur les donnes (mais sans les manipuler). Le SQLBuilder peut vous aider rapidement et aisment crire vos requtes. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. DB version Slectionnez la version de Vertica que vous utilisez. Use an existing connec- Cochez cette case lorsque vous utilisez le composant tVertion ticaConnection. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Host Port Database Schema Adresse IP du serveur de base de donnes. Numro du port dcoute du serveur de base de donnes. Nom de la base de donnes. Nom exact du schma.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

949

Proprits du tVerticaRow

Username et Password Informations dauthentification de lutilisateur de base de donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Table name Query type Nom de la table lire. Peut tre Built-in ou Repository. Built-in : Saisissez manuellement votre requte ou construisez-la laide de SQLBuilder. Repository : Slectionnez la requte approprie dans le Repository. Le champ Query est renseign automatiquement. Query Saisissez votre requte en faisant particulirement attention lordre des champs afin quils correspondent la dfinition du schma. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects.

Die on error

Advanced settings

Propagate QUERYs re- Cochez cette case pour insrer les rsultats de la requte cordset dans une colonne du flux en cours. Slectionnez cette colonne dans la liste use column. Use PreparedStatement Cochez cette case pour utiliser une instance PreparedStatement afin de requter votre base de donnes. Dans le tableau Set PreparedStatement Parameter, dfinissez les valeurs des paramtres reprsents par des ? dans linstruction SQL dfinie dans le champ Query de longlet Basic settings. Parameter Index : Saisissez la position du paramtre dans linstruction SQL. Parameter Type : Saisissez le type du paramtre. Parameter Value : Saisissez la valeur du paramtre. Cette option est trs utile si vous devez effectuer de nombreuses fois la mme requte. Elle permet un gain de performance. Commit every Nombre de lignes inclure dans le lot avant de commencer lcriture dans la base. Cette option garantit la qualit de la transaction (cependant pas de rollback) et surtout une meilleure performance dexcution.

950

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant offre la flexibilit des requtes sur les bases de donnes et couvre toutes les possibilits de requtes SQL.

Scnario associ
Pour un scnario associ au composant tVerticaRow, consultez : la section intitule Scnario : Rinitialiser lauto-incrmentation dune base de donnes du tDBSQLRow. la section intitule Scnario 1 : Supprimer et re-gnrer un index de table MySQL du tMysqlRow.

Guide de Rfrence des Composants Talend Open Studio

951

Guide de Rfrence des Composants Talend Open Studio

Composants ELT
Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille ELT de la Palette de Talend Open Studio. La famille ELT regroupe les connecteurs de bases de donnes les plus courants, ainsi que des composants de traitement, tous ddis au mode ELT dans lequel les SGBD cibles deviennent des outils de transformation. Ce mode supporte les bases de donnes les plus courantes, comme Teradata, Oracle, Vertica, Netezza, Sybase, etc.

Guide de Rfrence des Composants Talend Open Studio

tCombinedSQLAggregate

tCombinedSQLAggregate

Proprits du tCombinedSQLAggregate
Famille de composant Fonction ELT/CombinedSQL Le composant tCombinedSQLAggregate collecte les valeurs de donnes dune ou plusieurs colonnes dune table dans des buts statistiques. Ce composant excute en temps rel des transformations de donnes dans le SGBD lui-mme. Ce composant fournit un ensemble de matrices bases sur des valeurs ou sur des calculs. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Group by Dfinit les ensembles dagrgation, dont les valeurs sont utilises pour les calculs. Output Column : Slectionnez le libell de colonne dans la liste fournie, base sur la structure de schma que vous avez dfinie. Vous pouvez ajouter autant de colonnes de sortie que vous le souhaitez afin daffiner les agrgations. Input Column : Slectionnez les libells des colonnes dentre afin de les faire correspondre au contenu attendu des colonnes de sortie, dans le cas o vous souhaitez que les libells du schma de sortie soient diffrents du schma dentre. Operations Slectionnez le type dopration et la valeur utiliser pour le calcul et le champ de sortie. Output Column : Slectionnez le champ de destination dans la liste. Function : Slectionnez lune des oprations suivantes effectuer sur les donnes : count, min, max, avg, sum, first, last, distinct et count (distinct). Input column : Slectionnez la colonne dentre partir de laquelle vous souhaitez collecter les valeurs agrger.

Objectif Basic settings

954

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer et agrger des colonnes dune table directement sur le SGBD

Advanced settings Utilisation

tStatCatcher Statistics

Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est utilis en tant que composant intermdiaire avec dautres composants de bases de donnes, en particulier les composants de connexion et de commit. n/a

Limitation

Scnario : Filtrer et agrger des colonnes dune table directement sur le SGBD
Le scnario suivant cre un Job ouvrant une connexion une base de donnes MySQL et : instancie en partie les schmas dune table de base de donnes (pour filtrer les colonnes), filtre deux colonnes dans la mme table afin de ne garder que les donnes correspondant aux deux conditions de filtre, collecte les donnes des colonnes filtres, regroupes par valeur(s) spcifique(s) et crit les donnes agrges dans une table cible de base de donnes. Pour filtrer et agrger les colonnes dune table de base de donnes : Dposez les composants suivants de la Palette dans lespace de modlisation graphique : tMysqlConnection, tCombinedSQLInput, tCombinedSQLFilter, tCombinedSQLAggregate, tCombinedSQLOutput et tMysqlCommit. Connectez les composants tMysqlConnection, tCombinedSQLInput et tMysqlCommit laide de liens OnSubjobOk. Connectez les composants tCombinedSQLInput, tCombinedSQLFilter, tCombinedSQLAggregate et tCombinedSQLOutput laide dun lien Combine.

Dans lespace de modlisation graphique, double-cliquez sur le composant tMysqlConnection pour afficher sa vue Component et dfinir ses proprits de base. Dans la vue Basic settings, configurez manuellement les informations de connexion la base de donnes ou slectionnez Repository dans la liste Property Type si votre connexion la base de donnes a dj t configure et stocke sous le nud Metadata de la vue Repository.

Guide de Rfrence des Composants Talend Open Studio

955

Scnario : Filtrer et agrger des colonnes dune table directement sur le SGBD

Pour plus dinformations concernant le stockage des mtadonnes dans le Repository, consultez le Guide utilisateur de Talend Open Studio.

Dans lespace de modlisation graphique, double-cliquez sur le composant tCombinedSQLInput pour afficher sa vue Component et dfinir ses proprits de base.

Dans le champ Table, saisissez le nom de la table source puis cliquez sur le bouton [...] ct du champ Edit schema afin de dfinir la structure des donnes. Le schma dfini dans le composant tCombinedSQLInput peut tre diffrent de celui de la table source, puisque vous pouvez instancier uniquement les colonnes souhaites de la table source. Le tCombinedSQLInput joue galement un rle de filtre des colonnes. Dans ce scnario, la table de la base de donnes source contient sept colonnes : id, first_name, last_name, city, state, date_of_birth, ainsi que salary et le composant tCombinedSQLInput instancie uniquement les quatre colonnes ncessaires lagrgation : id, state, date_of_birth, et salary de la table source.

Dans lespace de modlisation graphique, double-cliquez sur le composant tCombinedSQLFilter afin dafficher sa vue Component et dfinir ses proprits de base.

956

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer et agrger des colonnes dune table directement sur le SGBD

Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent, ou configurez manuellement le schma en slectionnant Built-in dans la liste Schema et en cliquant sur le bouton [...] ct du champ Edit schema. Lorsque vous dfinissez la structure des donnes du composant tCombinedSQLFilter, le nom des colonnes apparat automatiquement dans la liste Input column dans le tableau Conditions. Dans ce scnario, le composant tCombinedSQLFilter instancie quatre colonnes : id, state, date_of_birth, et salary. Dans le tableau Conditions, configurez les paramtres dentre, les oprateurs et les valeurs attendues pour extraire les enregistrements correspondant aux critres spcifis. Dans ce scnario, le composant tCombinedSQLFilter filtre les colonnes state et date_of_birth dans la table source afin dextraire uniquement les employs ns aprs le 19 octobre 1960, habitant dans les Etats Utah, Ohio et Iowa. Slectionnez And dans la liste Logical operator between conditions afin dappliquer les deux conditions la fois. Vous pouvez galement personnaliser les conditions en cochant la case Use custom SQL et en ditant les conditions dans le champ de texte. Dans lespace de modlisation graphique, double-cliquez sur le composant tCombinedSQLAggregate afin dafficher sa vue Component et dfinir ses proprits de base. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent, ou configurez manuellement le schma en slectionnant Built-in dans la liste Schema et en cliquant sur le bouton [...]. Le composant tCombinedSQLAggregate instancie quatre colonnes : id, state, date_of_birth, et salary, provenant du composant prcdent.

Guide de Rfrence des Composants Talend Open Studio

957

Scnario : Filtrer et agrger des colonnes dune table directement sur le SGBD

Le tableau Group by vous permet de dfinir les ensembles de donnes traiter partir dune colonne dfinie, State dans cet exemple. Dans le tableau Group by, cliquez sur le bouton [+] pour ajouter une ligne. Dans la liste droulante Output column, slectionnez State. Cette colonne sera utilise pour stocker les donnes filtres de la colonne State. Le tableau Operations vous permet de configurer le type dagrgation effectuer. La liste disponible dans la colonne Output column dpend du schma que vous souhaitez crire en sortie (via le composant tCombinedSQLOutput). Dans ce scnario, le but est de regrouper les employs selon lEtat dans lequel il vivent, de calculer le nombre demploys par Etat, les salaires moyen/minimum/maximum ainsi que de retourner la date de naissance de lemploy le plus g et de lemploy de plus jeune de chaque tat. Dans le tableau Operations, cliquez sur le bouton [+] pour ajouter une ou plusieurs ligne(s) puis cliquez dans la liste Output column afin de slectionner la colonne de sortie qui contiendra les donnes calcules. Cliquez dans la ligne Function et slectionnez lopration effectuer. Dans lespace de modlisation graphique, double-cliquez sur le tCombinedSQLOutput afin dafficher sa vue Component et dfinir ses proprits de base.

Dans la liste Database type, slectionnez la base de donnes correspondante.

958

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer et agrger des colonnes dune table directement sur le SGBD

Dans la liste Component List, slectionnez le composant de connexion correspondant si plus dun composant de connexion est utilis. Dans le champ Table, saisissez le nom de la table cible qui stockera les rsultats agrgs. Dans cet exemple, il nest pas ncessaire de renseigner le champ Schema, puisque la base de donnes utilise est Oracle. Cliquez sur le bouton [...] ct du champ Edit schema pour dfinir la structure des donnes de la table cible. Dans ce scnario, le composant tCombinedSQLOutput instancie sept colonnes provenant du composant prcdent dans le Job (tCombinedSQLAggregate) : state, empl_count, avg_salary, min_salary, max_salary, oldest_empl et youngest_empl. Dans lespace de modlisation graphique, double-cliquez sur le tCombinedSQLCommit afin dafficher sa vue Component et dfinir ses proprits de base. Dans la liste Component list, slectionnez le composant de connexion la base de donnes correspondant si plusieurs ont t utiliss. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Des lignes sont insres dans une table compose de sept colonnes, empl_by_state, dans la base de donnes. La table affiche, par Etat dfini, le nombre demploys, les salaires moyen/minimum/maximum et retourne la date de naissance de lemploy le plus g et de lemploy le plus jeune de chaque tat.

Guide de Rfrence des Composants Talend Open Studio

959

tCombinedSQLFilter

tCombinedSQLFilter

Proprits du tCombinedSQLFilter
Famille de composant Fonction ELT/CombinedSQL Le composant tCombinedSQLFilter vous permet de modifier le schma de la table source via le mapping des colonnes et de dfinir un filtre sur cette table. Ce composant peut donc filtrer des colonnes et des lignes en mme temps. Il filtre en temps rel les donnes dans le SGBD lui-mme. Ce composant permet de filtrer des donnes en rorganisant, supprimant ou ajoutant des colonnes partir de la table source et de filtrer la source de donnes laide de conditions de filtre. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Logical operator bet- Slectionnez loprateur logique ajouter entre les ween conditions conditions de filtre dfinies dans le tableau Conditions . Les deux oprateurs disponibles sont : Or et And. Conditions Cliquez sur le bouton [+] pour ajouter autant de conditions que voulu. Les conditions sont excutes les unes aprs les autres pour chaque ligne. Input Column : Slectionnez la colonne filtrer. Operator : Slectionnez le type de clause WHERE : =, < >, >, <, >=, <=, LIKE, IN, NOT IN, et EXIST IN. Value : Saisissez les valeurs utiliser dans la clause WHERE. Negate : Cochez cette case pour activer la condition contraire celle dfinie. Use custom SQL Cochez cette case afin de personnaliser une clause WHERE en ditant le code dans le champ SQL Condition. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Objectif

Basic settings

Advanced settings

tStatCatcher Statistics

960

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Utilisation

Ce composant est utilis en tant que composant intermdiaire avec dautres composants de bases de donnes, en particulier les composants de connexion et de commit. n/a

Limitation

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD .

Guide de Rfrence des Composants Talend Open Studio

961

tCombinedSQLInput

tCombinedSQLInput

Proprits du tCombinedSQLInput
Famille de composant Fonction ELT/CombinedSQL Le composant tCombinedSQLInput extrait des champs dune table de base de donnes partir de son schma. Ce composant possde galement des fonctionnalits de filtre puisque son schma peut tre diffrent de celui de la table de la base de donnes. Le composant tCombinedSQLInput extrait des champ dune table de base de donnes selon la dfinition de son schma. Il passe ensuite la liste des champs au composant suivant via un lien de type Combine. Le schma du tCombinedSQLInput peut tre diffrent de celui de la table source de la base de donnes mais lordre des colonnes doit tre le mme. Table Schema Saisissez le nom de la table source de la base de donnes. Saisissez le nom du schma de la table source. Renseignez ce champ si vous utilisez Oracle. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le du Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Add additional columns Cette option vous permet deffectuer des actions sur les colonnes, lexception des actions dinsertion, de mise jour, de suppression ou qui ncessitent un prtraitement particulier. Name : Saisissez le nom de la colonne du schma devant tre modifie. SQL expression : Saisissez lexpression SQL excuter pour modifier les donnes dans la colonne correspondante. Advanced settings Usage tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Objectif

Basic settings

Ce composant est utilis en tant que composant intermdiaire avec dautres composants de bases de donnes, en particulier les composants de connexion et de commit.

962

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Limitation

n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD .

Guide de Rfrence des Composants Talend Open Studio

963

tCombinedSQLOutput

tCombinedSQLOutput

Proprits du tCombinedSQLOutput
Famille de composant Fonction Objectif Basic settings ELT/CombinedSQL Le composant tCombinedSQLOutput insre des enregistrements dans une table de base de donnes existante. Le tCombinedSQLOutput insre des enregistrements du flux entrant dans une table de base de donnes existante. Database Type Component list Slectionnez le type de base de donnes. Slectionnez le composant de connexion la base de donnes correspondant si plus dun est utilis dans le Job. Saisissez le nom de la table cible de la base de donnes. Saisissez le nom du schma de la table cible. Renseignez ce champ si vous utilisez Oracle. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Action on data Slectionnez INSERT dans la liste afin dinsrer les enregistrements du flux dentre dans la table cible de la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Table Schema

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant est utilis en tant que composant intermdiaire avec dautres composants de bases de donnes, en particulier les composants de connexion et de commit. n/a

Limitation

964

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD .

Guide de Rfrence des Composants Talend Open Studio

965

tELTJDBCInput

tELTJDBCInput

Proprits de tELTJDBCInput
Les composants tELTJDBCInput, tELTJDBCOutput, et tELTJDBCMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base JDBC afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif Basic settings ELT/Map/JDBC Fournit le schma de la table dentre la commande SQL qui sera excute. Permet dajouter autant de tables que ncessaires dans une commande Insert qui peut tre complexe. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Le schma dfini est ensuite pass au composant ELT Mapper afin de lutiliser dans la commande SQL Insert Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Default Table Name Default Schema Name Advanced settings Utilisation tStatCatcher Statistics Saisissez le nom de la table par dfaut. Saisissez le nom du schma par dfaut. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Lutilisation du composant tELTJDBCInput est troitement lie celle du tELTJDBCMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant un composant semblable au tELTJDBCInput, consultez les scnarios suivants du composant tELTMysqlMap :

966

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

967

tELTJDBCMap

tELTJDBCMap

Proprits de tELTJDBCMap
Les composants tELTJDBClInput, tELTJDBCOutput, et tELTJDBCMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base JDBC afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie.

Famille de composant Fonction Objectif

ELT/Map/JDBC Permet de construire votre commande SQL graphiquement en utilisant la table fournie en entre. Utilise les tables fournies en entre pour alimenter les paramtres ncessaires lexcution de la commande SQL souhaite. La commande peut contenir des jointures internes comme externes entre diffrentes tables ou entre une table et ses alias. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. ELT JDBC Map Editor Lditeur ELT du Mapper vous permet de dfinir le schma de sortie ainsi que de construire graphiquement la commande SQL excuter. Le nom des colonnes du schma peut tre diffrent du nom des colonnes dans la base de donnes. Style link Slectionnez le type daffichage des liens.

Basic settings

968

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Auto : par dfaut, les liens entre les schmas dentre et de sortie et les paramtres du service Web sont en forme de courbe. Bezier curve : les liens entre les schmas et les paramtres du service Web sont en forme de ligne. Line : les liens entre les schmas et les paramtres du service Web sont en forme de lignes droites. Cette option vous permettra doptimiser les performances. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Advanced settings Adresse IP du serveur de base de donnes Numro de port dcoute du serveur de la base. Nom de la base de donnes

Username et Password Donnes dauthentification de lutilisateur de la base Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Lutilisation du composant tELTJDBCMap est troitement lie celle des composants tELTJDBCInput et tELTJDBCOutput. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios associs, consultez les scnarios suivants du composant tELTMysqlMap dans : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

969

tELTJDBCOutput

tELTJDBCOutput

Proprits de tELTJDBCOutput
Les composants tELTJDBCInput, tELTJDBCOutput, et tELTJDBCMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base MSSql afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille du composant Fonction Objectif Basic settings ELT/Map/JDBC Effectue laction sur la table telle que spcifie et insre les donnes selon le schma de sortie dfini dans le Mapper ELT. Excute la requte Insert dans la base de donnes JDBC. Action on data Sur les donnes de la table dfinie, vous pouvez effectuer les oprations suivantes : Insert : Ajoute de nouvelles lignes la table. Si des doublons sont identifis, le Job sarrte. Update : Met jour des lignes existantes. Delete : Supprime les entres correspondantes au flux dentre. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Where clauses for (for Saisissez la clause permettant de filtrer les donnes UPDATE and DELETE mettre jour ou supprimer lors des oprations de mise only) jour ou de suppression. Default Table Name Default Schema Name Saisissez le nom de la table par dfaut, entre guillemets doubles. Saisissez le nom du schma par dfaut, entre guillemets doubles.

Use different table name Cochez cette case afin de dfinir le nom dune table de sortie diffrente, entre guillemets doubles, dans le champ Table name qui apparat. Advanced settings tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau du composant.

970

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Utilisation

Lutilisation du composant tELTJDBCOutput est troitement lie celle des composants tELTJDBCInput et tELTJDBCMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant un composant semblable au tELTJDBCOutput, consultez les scnarios suivants du composant tELTJDBCMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

971

tELTMSSqlInput

tELTMSSqlInput

Proprits de tELTMSSqlInput
Les composants tELTMSSqlInput, tELTMSSqlOutput, et tELTMSSqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base MSSql afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif Basic settings ELT/Map/MSSql Fournit le schma de la table dentre la commande SQL qui sera excute. Permet dajouter autant de tables que ncessaires dans une commande Insert qui peut tre complexe. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Le schma dfini est ensuite pass au composant ELT Mapper afin de lutiliser dans la commande SQL Insert Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Default Table Name Default Schema Name Advanced settings Utilisation tStatCatcher Statistics Saisissez le nom de la table par dfaut. Saisissez le nom du schma par dfaut. Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTMSSqlInput est troitement lie celle du tELTMSSqlMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant un composant semblable au tELTMSSqlInput, consultez les scnarios suivants du composant tELTMysqlMap dans :

972

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

973

tELTMSSqlMap

tELTMSSqlMap

Proprits de tELTMSSqlMap
Les composants tELTMSSqlInput, tELTMSSqlOutput, et tELTMSSqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base MSSql afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie.

Famille de composant Fonction Objectif

ELT/Map/MSSql Permet de construire votre commande SQL graphiquement en utilisant la table fournie en entre. Utilise les tables fournies en entre pour alimenter les paramtres ncessaires lexcution de la commande SQL souhaite. La commande peut contenir des jointures internes comme externes entre diffrentes tables ou entre une table et ses alias. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. ELT MSSql Map Editor Lditeur ELT du Mapper vous permet de dfinir le schma de sortie ainsi que de construire graphiquement la commande SQL excuter. Le nom des colonnes du schma peut tre diffrent du nom des colonnes dans la base de donnes. Style link Slectionnez le type daffichage des liens.

Basic settings

974

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Auto : par dfaut, les liens entre les schmas dentre et de sortie et les paramtres du service Web sont en forme de courbe. Bezier curve : les liens entre les schmas et les paramtres du service Web sont en forme de ligne. Line : les liens entre les schmas et les paramtres du service Web sont en forme de lignes droites. Cette option vous permettra doptimiser les performances. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Advanced settings Adresse IP du serveur de base de donnes. Numro de port dcoute du serveur de la base. Nom de la base de donnes.

Username et Password Donnes dauthentification de lutilisateur de la base. Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau du composant.

Lutilisation du composant tELTMSSqlMap est troitement lie celle des composants tELTMSSqlInput et tELTMSSqlOutput. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios associs, consultez les scnarios suivants du composant tELTMysqlMap dans : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

975

tELTMSSqlOutput

tELTMSSqlOutput

Proprits de tELTMSSqlOutput
Les composants tELTMSSqlInput, tELTMSSqlOutput, et tELTMSSqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base MSSql afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille du composant Fonction Objectif Basic settings ELT/Map/MSSql Effectue laction sur la table telle que spcifie et insre les donnes selon le schma de sortie dfini dans le Mapper ELT. Excute la requte Insert dans la base de donnes MSSql. Action on data Sur les donnes de la table dfinie, vous pouvez effectuer les oprations suivantes : Insert : Ajoute de nouvelles lignes la table. Si des doublons sont identifis, le Job sarrte. Update : Met jour des lignes existantes. Delete : Supprime les entres correspondantes au flux dentre. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Where clauses for (for Saisissez la clause permettant de filtrer les donnes UPDATE and DELETE mettre jour ou supprimer lors des oprations de mise only) jour ou de suppression. Default Table Name Default Schema Name Saisissez le nom de la table par dfaut, entre guillemets doubles. Saisissez le nom du schma par dfaut, entre guillemets doubles.

Use different table name Cochez cette case afin de dfinir le nom dune table de sortie diffrente, entre guillemets doubles, dans le champ Table name qui apparat. Advanced settings tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

976

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Utilisation

Lutilisation du composant tELTMSSqlOutput est troitement lie celle des composants tELTMSSqlInput et tELTMSSqlMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant un composant semblable au tELTMSSqlOutput, consultez les scnarios suivants du composant tELTMysqlMap dans : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

977

tELTMysqlInput

tELTMysqlInput

Proprits de tELTMysqlInput
Les composants tELTMysqlInput, tELTMysqlOutput, et tELTMysqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base MySQL afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif Basic settings ELT/Map/Mysql Fournit le schma de la table dentre la commande SQL qui sera excute. Permet dajouter autant de tables que ncessaires dans une commande Insert qui peut tre complexe. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Le schma dfini est ensuite pass au composant ELT Mapper afin de lutiliser dans la commande SQL Insert Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Default Table Name Advanced settings Utilisation tStatCatcher Statistics Saisissez le nom de la table par dfaut, entre guillemets doubles. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau du composant.

Lutilisation du composant tELTMysqlInput est troitement lie celle du tELTMysqlMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant le composant tELTMysqlInput, consultez les scnarios suivants du composant tELTMysqlMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre .

978

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

979

tELTMysqlMap

tELTMysqlMap

Proprits de tELTMysqlMap
Les composants tELTMysqlInput, tELTMysqlOutput, et tELTMysqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base MySQL afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif ELT/Map/Mysql Permet de construire votre commande SQL graphiquement en utilisant la table fournie en entre. Utilise les tables fournies en entre pour alimenter les paramtres ncessaires lexcution de la commande SQL souhaite. La commande peut contenir des jointures internes comme externes entre diffrentes tables ou entre une table et ses alias. DB Version Slectionnez la version de MySQL que vous utilisez. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. ELT Mysql Map editor Lditeur ELT du Mapper vous permet de dfinir le schma de sortie ainsi que de construire graphiquement la commande SQL excuter. Le nom des colonnes du schma peut tre diffrent du nom des colonnes dans la base de donnes. Style link Slectionnez le type daffichage des liens.

Basic settings

980

Guide de Rfrence des Composants Talend Open Studio

Proprits de tELTMysqlMap

Auto : par dfaut, les liens entre les schmas dentre et de sortie et les paramtres du service Web sont en forme de courbe. Bezier curve : les liens entre les schmas et les paramtres du service Web sont en forme de ligne. Line : les liens entre les schmas et les paramtres du service Web sont en forme de lignes droites. Cette option vous permettra doptimiser les performances. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Preview Adresse IP du serveur de base de donnes Numro de port dcoute du serveur de la base. Nom de la base de donnes Laperu est un clich des donnes traites dans le Mapper. Il apparat lorsque les proprits du Mapper ont t compltes. La synchronisation de laperu nest disponible quaprs avoir enregistrer les modifications.

Username et Password Donnes dauthentification de lutilisateur de la base

Utilisation

Lutilisation du composant tELTMysqlMap est troitement lie celle des composants tELTMysqlInput et tELTMysqlOutput. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Connecter les composants ELT


Les composants ELT ne traitent pas les donnes en tant que telles mais les informations du schma descriptif de la table qui seront utilises pour alimenter les paramtres de la requte SQL excuter. Par consquent la connexion requise pour relier ces diffrents composants est simplement un lien qui porte le nom de la table. Le nom de la sortie que vous donnez ce lien lors de sa cration doit correspondre exactement au nom de la table car ce paramtre sera utilis lors de la gnration de la commande SQL. Voir galement le Guide utilisateur de Talend Open Studio

Tables de jointure et de correspondance


Dans le Mapper ELT, vous pouvez slectionner des colonnes spcifiques des schmas dentre et les ajouter dans le schma de sortie. De la mme manire que dans lditeur du Mapper ETL, simplement glissez et dposez le contenu du schma dentre vers le schma de sortie.

Guide de Rfrence des Composants Talend Open Studio

981

Scnario 1 : Agrger les colonnes dune table et appliquer un filtre

Utilisez les touches Ctrl et Maj pour la slection multiple des colonnes contigus ou non. Vous pouvez mettre en place des jointures explicites pour extraire des donnes varies de diffrentes tables. Cliquez sur la liste droulante Join et slectionnez une jointure explicite. Les jointures suivantes sont disponibles : Inner Join, Left Outer Join, Right Outer Join ou Full Outer Join et Cross Join. Par dfaut la jointure interne (Inner Join) est slectionne. Vous pouvez galement crer des tables Alias afin de slectionner des donnes varies dans une mme table. Dans la zone Input, cliquez sur le bouton plus [+] pour crer un Alias. Dfinissez la table sur laquelle lalias est bas. Saisissez un nom pour la table alias, de prfrence veillez ce quil soit diffrent de la table principale pour viter les confusions.

Ajouter des clauses WHERE


Vous pouvez galement restreindre la requte Select laide dune clause WHERE. Cliquez sur le bouton Add filter row situ en haut de la table de sortie et saisissez la condition que vous souhaitez appliquer. Veillez ce que les composants dentre soient tous lis correctement au composant ELT Map pour garantir que les inclusions, jointures et clauses fonctionnent.

Gnrer la requte SQL


La mise en correspondance des lments partir des schmas dentre vers les schmas de sortie cre automatiquement la requte Select correspondante.

Les ventuelles clauses sont galement prises en compte automatiquement.

Scnario 1 : Agrger les colonnes dune table et appliquer un filtre


Le scnario suivant dcrit un Job rassemblant plusieurs schmas dune table de base de donnes en entre puis utilise une clause dans la requte SQL afin de filtrer les donnes en sortie.

982

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Agrger les colonnes dune table et appliquer un filtre

Cliquez et dposez les composants suivants de la Palette dans lespace de modlisation graphique : trois tELTMysqlIntput, un tELTMysqlMap, et un tELTMysqlOutput. Double-cliquez sur le premier tELTMysqlInput afin dafficher sa vue Basic settings.

Dans la liste Schema, slectionnez Repository, cliquez sur le bouton [...] ct du champ Edit schema. Dans la bote de dialogue [Repository Content], slectionnez votre connexion la base de donnes ainsi que le schma souhait. Le nom du schma slectionn apparat automatiquement dans le champ Default Table Name. Dans ce scnario, la connexion la base de donnes est Talend_MySQL et le schma pour le premier composant dentre est owners. Configurez les deuxime et troisime composants tELTMysqlInput de la mme manire, mais slectionnez cars et resellers respectivement comme nom de schma. Dans ce scnario, tous les schmas dentre sont stocks dans la zone Metadata du Repository, afin que vous les retrouviez facilement. Pour plus dinformations concernant les mtadonnes, consultez le Guide utilisateur de Talend Open Studio. Vous pouvez galement slectionner les trois composants dentre en dposant les schmas correspondants de la zone Metadata dans lespace de modlisation graphique et en double-cliquant sur le composant tELTMysqlInput dans le bote de dialogue [Components]. Cela vous permet dviter les tapes de nommage des composants et de dfinition de leur schma. Reliez les trois composants tELTMysqlInput au composant tELTMysqlMap laide de liens nomms strictement selon le nom des tables de la base de donnes : owners, cars et resellers.

Guide de Rfrence des Composants Talend Open Studio

983

Scnario 1 : Agrger les colonnes dune table et appliquer un filtre

Reliez ensuite le composant tELTMysqlMap au tELTMysqlOutput et nommez le lien agg_result, qui est le nom de la table de la base de donnes dans laquelle vous allez sauvegarder le rsultat de lagrgation. Cliquez sur le composant tELTMysqlMap afin dafficher sa vue Basic settings et configurer ses proprits.

Slectionnez Repository dans la liste Property Type et slectionnez la connexion la base de donnes utilise pour les composants dentre. Toutes les informations de la base de donnes sont automatiquement rcupres. Laissez les paramtres configurs par dfaut Double-cliquez sur le composant tELTMysqlMap afin douvrir le Map Editor pour mettre en place les jointures entre les tables dentre (Input) et configurer le flux de sortie.

Ajoutez les tables dentre en cliquant sur le bouton [+] dans le coin suprieur gauche de lditeur et slectionnez les noms des tables correspondants dans la bote de dialogue [Add a new alias]. Glissez-dposez la colonne ID_Owner partir de la table owners vers la colonne correspondante dans la table cars. Dans la table cars, cochez la case Explicit Join en face de ID_Owners. Une jointure INNER JOIN, le type de jointure par dfaut, saffiche dans la liste des jointures. Glissez la colonne ID_Resellers partir de la table cars vers la colonne correspondante de la table Resellers pour mettre en place la seconde jointure. Dfinissez nouveau une option de jointure INNER JOIN. Puis slectionnez les colonnes agrger dans la table de sortie, agg_result.

984

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Agrger les colonnes dune table et appliquer un filtre

Dposez les colonnes ID_Owners, Name et ID_Insurance de la table owners dans la table de sortie. Dposez les colonnes Registration, Make et Color de la table cars dans la table de sortie. Dposez les colonnes Name_Reseller et City de la table resellers dans la table de sortie. Avec les colonnes correspondantes slectionnes, la mise en correspondance apparat en jaune et les jointures en violet. Appliquez un filtre sur la table de sortie. Cliquez sur le bouton Add filter row en haut de la table de sortie afin dafficher le champ textuel Additional clauses, dposez la colonne City de la table resellers dans le champ textuel puis dfinissez la clause WHERE : resellers.City =Augusta.

Cliquez sur longlet Generated SQL Select query afin dafficher linstruction SQL correspondante.

Cliquez OK pour sauvegarder le paramtrage de lELT Map. Double-cliquez sur le composant tELTMysqlOutput afin dafficher sa vue Basic settings.

Guide de Rfrence des Composants Talend Open Studio

985

Scnario 2 : ELT utilisant une table Alias

Dans la liste Action on data slectionnez laction que vous souhaitez effectuer sur les donnes. Slectionnez Repository dans la liste Schema et dfinissez le schma de sortie de la mme manire que pour les schmas dentre. Notez que le schma de sortie doit tre nomm comme la table dans laquelle vous souhaitez sauvegarder vos rsultats daggrgation, agg_result dans ce scnario. Vous pouvez galement utiliser un schma en mode Built-In et rcuprer la structure du schma du composant prcdent. Cependant, vous devez tre sr davoir spcifi une table cible existant dans votre base de donnes, ayant la mme structure de donnes. Laissez les autres paramtres configurs par dfaut. Sauvegardez votre Job et appuyez sur la touche F6 pour lexcuter. Toutes les donnes slectionnes sont insres dans la table agg_result comme spcifi dans linstruction SQL.

Scnario 2 : ELT utilisant une table Alias


Le scnario suivant dcrit un Job mappant des informations provenant des deux tables dentre et dune table Alias servant de table dentre virtuelle, vers une table de sortie. La table employees contient lID des employs, le numro de leur service, leur nom et lID de leur responsable. Ces responsables sont galement considrs comme des employs et par consquent inclus dans la table employees. La table dept contient les informations de service des employs. La table Alias rcupre le nom des responsables de la table employees.

Glissez et dposez de la Palette dans lespace de modlisation graphique deux composants tELTMysqlInput, un tELTMysqlMap et un tELTMysqlOutput.

986

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : ELT utilisant une table Alias

Nommez-les comme vous le souhaitez afin de dcrire au mieux leur fonctionnalit. Double-cliquez sur le premier composant tELTMysqlInput afin dafficher sa vue Basic settings et configurer ses proprits de base.

Slectionnez Repository dans la liste Schema puis dfinissez la connexion la base de donnes ainsi que le schma, en cliquant sur le bouton [...] ct du champ Edit Schema. La connexion la base de donnes est Talend_MySQL et le schma du premier composant dentre est employees. Dans ce scnario, les schmas dentre sont stocks dans le Repository, sous le nud Metadata, afin que vous puissiez les rcuprer plus facilement. Pour plus dinformations concernant les mtadonnes, consultez le Guide utilisateur de Talend Open Studio. Configurez le second composant tELTMysqlInput de la mme manire, mais slectionnez dept comme nom de schma. Double-cliquez sur le composant tELTMysqlOutput afin dafficher sa vue Basic settings et dfinir ses proprits.

Dans la liste Action on data, slectionnez laction que vous souhaitez effectuer, Insert dans ce scnario. Dans la liste Schema, slectionnez Repository et dfinissez le schma de sortie de la mme manire que pour les schmas dentre. Dans ce scnario, slectionnez result comme schma de sortie, qui est le nom de la table de la base de donnes utilise pour stocker le rsultat du mapping. Le schma de sortie contient toutes les colonnes des schmas dentre ainsi quune colonne ManagerName. Laissez les autres paramtres configurs par dfaut. Reliez les deux composants tELTMysqlInput au tELTMysqlMap laide de liens Link nomms strictement selon le nom des tables dentre, employees et dept dans ce scnario. Reliez le composant tELTMysqlMap au tELTMysqlOutput laide dun lien Link. Cliquez sur Yes (Oui) louverture de la bote de dialogue pour permettre au Mapper ELT de rcuprer la structure de la table de sortie partir du schma de sortie.

Guide de Rfrence des Composants Talend Open Studio

987

Scnario 2 : ELT utilisant une table Alias

Cliquez sur le composant tELTMysqlMap afin dafficher sa vue Basic settings et configurer ses proprits de base.

Dans la liste Property Type, slectionnez Repository puis slectionnez la connexion la base de donnes utilise dans les composants dentre. Les informations de connexion la base de donnes sont automatiquement rcupres. Laissez les autres paramtres configurs par dfaut. Cliquez sur le bouton [...] ct du champ ELT Mysql Map Editor ou double-cliquez sur le composant tELTMysqlMap dans lespace de modlisation graphique afin douvrir le ELT Map Editor. Le composant tELTMysqlMap est connect au composant de sortie, la table de sortie est donc affiche dans la zone correspondante. Ajoutez les tables dentre employees et dept dans la zone dentre, en cliquant sur le bouton [+] et en slectionnant le nom des tables correspondant dans la bote de dialogue [Add a new alias]. Lorsque vous crez une table Alias partir de la table employees en slectionnant employees dans la liste Select the table to use et en saisissant Managers dans le champ Type in a valid alias, dans la bote de dialogue [Add a new alias].

Dposez la colonne DeptNo de la table employees dans la table dept. Cochez la case Explicit join devant la colonne DeptNo de la table dept afin de configurer une jointure Inner Join. Dposez la colonne ManagerId de la table employees dans la colonne ID de la table Managers. Cochez la case Explicit join devant la colonne ID de la table Managers et slectionnez LEFT OUTER JOIN dans la list Join, afin que les lignes de sortie puissent contenir des valeurs Null.

988

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : ELT utilisant une table Alias

Dposez toutes les colonnes de la table employees dans les colonnes correspondantes de la table de sortie. Dposez les colonnes DeptName et Location de la table dept dans les colonnes correspondantes de la table de sortie. Dposez la colonne Name de la table Managers dans la colonne ManagerName de la table de sortie.

Cliquez sur longlet Generated SQL Select query pour afficher linstruction SQL excuter.

Guide de Rfrence des Composants Talend Open Studio

989

Scnario 2 : ELT utilisant une table Alias

Sauvegardez votre Job et appuyez sur F6 pour lexcuter. La table de sortie result de la base de donnes contient toutes les informations concernant les employs, y compris le nom de leurs responsables respectifs.

990

Guide de Rfrence des Composants Talend Open Studio

tELTMysqlOutput

tELTMysqlOutput

Proprits de tELTMysqlOutput
Les composants tELTMysqlInput, tELTMysqlOutput, et tELTMysqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base MySQL afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille du composant Fonction Objectif Basic settings ELT/Map/Mysql Effectue laction sur la table telle que spcifie et insre les donnes selon le schma de sortie dfini dans le Mapper ELT. Excute la requte Insert dans la base de donnes Mysql Action on data Sur les donnes de la table dfinie, vous pouvez effectuer les oprations suivantes : Insert : Ajoute de nouvelles lignes la table. Si des doublons sont identifis, le Job sarrte. Update : Met jour des lignes existantes. Delete : Supprime les entres correspondantes au flux dentre. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Where clauses for (for Saisissez la clause permettant de filtrer les donnes UPDATE and DELETE mettre jour ou supprimer lors des oprations de mise only) jour ou de suppression. Default Table Name Saisissez le nom de la table par dfaut, entre guillemets doubles.

Use different table name Cochez cette case afin de dfinir le nom dune table de sortie diffrente, entre guillemets doubles, dans le champ Table name qui apparat. Utilisation Lutilisation du composant tELTMysqlOutput est troitement lie celle des composants tELTMysqlInput et tELTMysqlMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table.

Guide de Rfrence des Composants Talend Open Studio

991

Scnarios associs

Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant le composant tELTMysqlOutput, consultez les scnarios suivants du composant tELTMysqlMap dans : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

992

Guide de Rfrence des Composants Talend Open Studio

tELTOracleInput

tELTOracleInput

Proprits de tELTOracleInput
Les composants tELTOracleInput, tELTOracleOutput, et tELTOracleMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Oracle afin de gnrer des commandes Insert, Udpate ou Delete y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif Basic settings ELT/Map/Oracle Fournit le schma de la table dentre la commande SQL qui sera excute. Permet dajouter autant de tables que ncessaires dans une commande Insert qui peut tre complexe. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Le schma dfini est ensuite pass au composant ELT Mapper afin de lutiliser dans la commande SQL Insert. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Default Table Name Default Schema Name Advanced settings Utilisation tStatCatcher Statistics Saisissez le nom de la table par dfaut, entre guillemets doubles. Saisissez le nom du schma par dfaut, entre guillemets doubles. Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTOracleInput est troitement lie celle du tELTOracleMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnario associ
Pour un scnario utilisant le composant tELTOracleInput, consultez la section intitule Scnario : Mettre jour les lignes dune base Oracle du composant tELTOracleMap.

Guide de Rfrence des Composants Talend Open Studio

993

tELTOracleMap

tELTOracleMap

Proprits de tELTOracleMap
Les composants tELTOracleInput, tELTOracleOutput, et tELTOracleMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Oracle afin de gnrer des commandes Insert, Update ou Delete y compris des clauses, qui devront tre excutes dans la table de sortie dfinie.

Famille de composant Fonction Objectif

ELT/Map/Oracle Permet de construire votre commande SQL graphiquement en utilisant la table fournie en entre. Utilise les tables fournies en entre pour alimenter les paramtres ncessaires lexcution de la commande SQL souhaite. La commande peut contenir des jointures internes comme externes entre diffrentes tables ou entre une table et ses alias. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. ELT Oracle Map Editor Lditeur ELT du Mapper vous permet de dfinir le schma de sortie ainsi que de construire graphiquement la commande SQL excuter. Le nom des colonnes du schma peut tre diffrent du nom des colonnes dans la base de donnes. Style link Slectionnez le type daffichage des liens.

Basic settings

994

Guide de Rfrence des Composants Talend Open Studio

Proprits de tELTOracleMap

Auto : par dfaut, les liens entre les schmas dentre et de sortie et les paramtres du service Web sont en forme de courbe. Bezier curve : les liens entre les schmas et les paramtres du service Web sont en forme de ligne. Line : les liens entre les schmas et les paramtres du service Web sont en forme de lignes droites. Cette option vous permettra doptimiser les performances. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Connection type DB Version Host Port Database Username et Password Advanced settings Liste droulante des pilotes disponibles. Slectionnez la version dOracle que vous utilisez. Adresse IP du serveur de base de donnes. Numro de port dcoute du serveur de la base. Nom de la base de donnes. Donnes dauthentification de lutilisateur de la base.

Additional JDBC Para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. Use Hint Options Cochez cette case afin dactiver la zone de configuration des hints, afin de vous permettre doptimiser lexcution dune requte. Dans cette zone, les paramtres sont : -HINT : spcifiez le hint dont vous avez besoin, laide de la syntaxe /*+ */. -POSITION : spcifiez o placer le hint dans linstruction SQL. -SQL STMT : slectionnez linstruction SQL utiliser. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau du composant.

Utilisation

Lutilisation du composant tELTOracleMap est troitement lie celle des composants tELTOracleInput et tELTOracleOutput. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Connecter les composants ELT


Pour plus dinformations concernant la connexion des composants ELT, consultez la section intitule Connecter les composants ELT Voir galement le Guide utilisateur de Talend Open Studio

Guide de Rfrence des Composants Talend Open Studio

995

Scnario : Mettre jour les lignes dune base Oracle

Tables de jointure et de correspondance


Dans le Mapper ELT, vous pouvez slectionner des colonnes des schmas dentre et les intgrer dans le schma de sortie. Pour plus dinformations concernant la mise en correspondance et les jointures, consultez la section intitule Tables de jointure et de correspondance Lorsque vous devez faire une jointure entre de nombreuses tables, ou faire une jointure entre tables avec des conditions multiples et des jointures externes, il est recommand dutiliser les options LEFT OUTER JOIN (+) et RIGHT OUTER JOIN (+) qui vous permettent dutiliser les mots cl privs Oracle. Pour plus dinformations concernant ces deux mots cl privs, consultez le site (en anglais) : http:// download.oracle.com/docs/cd/B19306_01/server.102/b14200/queries006.htm

Ajouter des clauses Where


Pour plus dinformations sur la manipulation des clauses, consultez la section intitule Ajouter des clauses WHERE

Gnrer la requte SQL


La mise en correspondance dlments des schmas dentre avec le schma de sortie cre automatiquement la requte Select correspondante. La/les clauses dfinies dans le mapper ELT sont galement intgres automatiquement dans la requte.

Scnario : Mettre jour les lignes dune base Oracle


Le scnario suivant est bas sur le scnario dagrgation, dans la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . Laction sur les donnes Update tant disponible en base Oracle, le scnario suivant dcrit un Job qui met jour des donnes particulires dans la table agg_result.

996

Guide de Rfrence des Composants Talend Open Studio

Scnario : Mettre jour les lignes dune base Oracle

Comme dcrit dans la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre , crez un Job dagrgation de donnes utilisant les composants ELT pour la base de donnes Oracle : tELTOracleInput, tELTOracleMap et tELTOracleOutput, puis excutez le Job afin de sauvegarder le rsultat de lagrgation dans une table de base de donnes nomme agg_result. Lorsque vous dfinissez des filtres dans lditeur ELT Map, notez que les chanes de caractres sont sensibles la casse dans la base de donnes Oracle. Lancez lditeur ELT Map et ajoutez une nouvelle table de sortie nomme update_data. Ajoutez une ligne de filtre la table update_data pour tablir une relation entre tables dentre et de sortie : owners.ID_OWNER = agg_result.ID_OWNER. Glissez la colonne MAKE de la table cars la table update_data. Glissez la colonne NAME_RESELLER de la table resellers la table update_data. Ajoutez un modle entour de guillemets simples, A8 dans cet exemple, dans la colonne MAKE de la table cars, prcd de deux barres verticales. Ajoutez Sold by, entour de guillemets simples devant la colonne Name_Reseller dans la table resellers, avec deux barres verticales au milieu.

Vrifiez la requte Select gnre dans longlet Generated SQL select query.

Cliquez sur OK pour valider les modifications et fermer le mapper ELT. Dsactivez le composant tELTOracleOutput nomm Agg_Result en cliquant-droit dessus et en slectionnant Deactivate Agg_Result dans le menu contextuel. Dposez un nouveau composant tELTOracleOutput de la Palette dans lespace de modlisation graphique. Nommez-le Update_Data afin didentifier plus clairement sa fonction. Reliez le composant tELTOracleMap au nouveau tELTOracleOutput laide du lien correspondant la nouvelle table de sortie dfinie dans le mapper, update_data dans ce scnario. Double-cliquez sur le composant tELTOracleOutput afin dafficher sa vue Component et dfinir ses proprits.

Guide de Rfrence des Composants Talend Open Studio

997

Scnario : Mettre jour les lignes dune base Oracle

Slectionnez Update dans la liste Action on data. Vrifiez le schma et cliquez sur Sync columns pour rcuprer la structure du schma du composant prcdent. Dans le champ WHERE clauses, entrez la clause suivante : agg_results.MAKE = Audi, pour mettre jour les donnes relatives la marque Audi dans la table de la base de donnes agg_result. Renseignez le champ Default Table Name en saisissant le nom du lien de sortie, update_data dans cet exemple. Cochez la case Use different table name et renseignez le champ Table name en saisissant le nom de la table mettre jour, agg_result dans ce scnario. Laissez les autres paramtres tels quils sont. Sauvegardez votre Job puis appuyez sur F6 pour lexcuter. Les donnes concernes ont t mises jour dans la table de la base de donnes.

998

Guide de Rfrence des Composants Talend Open Studio

tELTOracleOutput

tELTOracleOutput

Proprits de tELTOracleOutput
Les composants tELTOracleInput, tELTOracleOutput, et tELTOracleMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Oracle afin de gnrer des commandes Insert, Update ou Delete y compris des clauses, et ces commandes devront tre excutes dans la table de sortie dfinie. Famille du composant Fonction Objectif Basic settings ELT/Map/Oracle Effectue laction sur la table telle que spcifie et insre les donnes selon le schma de sortie dfini dans le Mapper ELT. Excute la requte Insert ou Update dans la base de donnes Oracle Action on data Sur les donnes de la table dfinie, vous pouvez effectuer les oprations suivantes : Insert : Ajoute de nouvelles lignes la table. Si des doublons sont identifis, le Job sarrte. Update : Met jour des lignes existantes. Delete : Supprime les entres correspondantes au flux dentre. MERGE : met jour ou insre les donnes dans la table. Les options disponibles pour lopration MERGE diffrent de celles disponibles pour les oprations Insert, Update et Delete. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Where clauses for (for Saisissez la clause permettant de filtrer les donnes UPDATE and DELETE mettre jour ou supprimer lors des oprations de mise only) jour ou de suppression. Use Merge Update Cochez cette case pour mettre jour des donnes de votre (pour MERGE) table de sortie. Column : Liste des colonnes du flux dentre. Update : Cochez la case correspondant au nom de la colonne que vous souhaitez mettre jour.

Guide de Rfrence des Composants Talend Open Studio

999

Scnario : Utiliser la fonction MERGE dOracle pour mettre jour et insrer simultanment des donnes

Use Merge Update Where Clause : Cochez cette case et saisissez la clause WHERE permettant de filtrer les donnes mettre jour, si ncessaire. Use Merge Update Delete Clause : Cochez cette case et saisissez la clause WHERE permettant de filtrer les donnes supprimer et mettre jour, si ncessaire. Use Merge Insert (pour Cochez cette case pour insrer des donnes dans la table. MERGE) Column : Liste des colonnes du flux dentre. Check All : Cochez la case correspondant au nom de la colonne que vous souhaitez insrer. Use Merge Update Where Clause : Cochez cette case et saisissez la clause WHERE permettant de filtrer les donnes insrer. Default Table Name Default Schema Name Saisissez le nom de la table par dfaut. Saisissez le nom du schma Oracle par dfaut.

Use different table name Cochez cette case afin de dfinir le nom dune table de sortie diffrente, entre guillemets doubles, dans le champ Table name qui apparat. Advanced settings Use Hint Options Cochez cette case pour activer la zone de configuration des hints lorsque vous souhaitez utiliser un hint pour optimiser l'excution d'une requte. Dans cette zone, les paramtres sont : - HINT : spcifiez l'hint dont vous avez besoin dans une instruction SQL. - POSITION : spcifiez o mettre l'hint dans une instruction SQL. - SQL STMT : slectionnez l'instruction SQL dont vous avez besoin. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTOracleOutput est troitement lie celle des composants tELTOracleInput et tELTOracleMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnario : Utiliser la fonction MERGE dOracle pour mettre jour et insrer simultanment des donnes
Le scnario suivant dcrit un Job permettant d'ajouter de nouvelles informations client dans une table de base de donnes grce la commande MERGE dOracle.

1000

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser la fonction MERGE dOracle pour mettre jour et insrer simultanment des donnes

De la Palette dans l'espace de modlisation graphique, glissez-dposez les composants suivants : tELTOracleInput, tELTOracleMap ainsi qu'un tELTOracleOutput et nommez-les de manire pouvoir identifier leur fonction. Double-cliquez sur le tELTOracleInput afin d'afficher sa vue Basic settings.

Dans la liste Schema, slectionnez Repository, cliquez sur le bouton [...] ct du champ Edit Schema puis slectionnez votre connexion de base de donnes ainsi que le schma souhait dans la bote de dialogue [Repository Content]. Le nom du schma slectionn apparat automatiquement dans le champ Default Table Name. Dans ce scnario, la connexion la base de donnes est Talend_Oracle et le schma est new_customers. Dans ce scnario, le schma d'entre est stock sous le nud Metadata du Repository afin de le retrouver facilement. Pour plus d'informations concernant les mtadonnes, consultez le Guide utilisateur de Talend Open Studio. Vous pouvez galement slectionner le composant d'entre en dposant le schma correspondant de la zone Metadata dans l'espace de modlisation graphique et en double-cliquant sur le tELTOracleInput dans la bote de dialogue [Components]. Cela vous permet d'viter les tapes de nommage du composant d'entre ainsi que la dfinition manuelle de son schma. Connectez le composant tELTOracleInput au tELTOracleMap l'aide d'un lien nomm strictement selon le nom de la table de base de donnes, new_customers dans cet exemple. Reliez le tELTOracleMap au tELTOracleOutput et nommez le lien customers_merge, c'est--dire comme le nom de la table dans laquelle vous souhaitez sauvegarder les rsultats du MERGE. Cliquez sur le composant tELTOracleMap afin d'afficher sa vue Basic settings. Le schma est configur comme suit :

Guide de Rfrence des Composants Talend Open Studio

1001

Scnario : Utiliser la fonction MERGE dOracle pour mettre jour et insrer simultanment des donnes

Slectionnez Repository dans la liste Property Type et choisissez la connexion la base de donnes que vous avez utilise pour les composants d'entre. Les informations relatives la base de donnes sont automatiquement rcupres. Laissez les autres champs tels qu'ils sont. Double-cliquez sur le composant tELTOracleMap afin d'ouvrir le Map Editor et configurer le flux de transformation de donnes. Affichez la table d'entre en cliquant sur le bouton [+] dans le coin suprieur gauche du Map Editor et en slectionnant le nom de la table correspondante dans le bote de dialogue [Add a new alias]. Dans ce scnario, la seule table d'entre est new_customers.

Slectionnez toutes les colonnes de la table d'entre et dposez-les dans la table de sortie.

1002

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser la fonction MERGE dOracle pour mettre jour et insrer simultanment des donnes

Cliquez sur Generated SQL Select query pour afficher l'instruction de la requte excuter.

Cliquez sur OK pour valider les paramtres ELT Map et fermer le Map Editor. Dans lespace de modlisation, double-cliquez sur le composant tELTOracleOutput pour paramtrer ses proprits dans la vue Component. Dans la liste Action on data, slectionnez MERGE. Cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent. Cochez la case Use Merge Update pour mettre jour les donnes via la fonction MERGE d'Oracle. Dans le tableau qui apparat, cochez les cases correspondant aux colonnes que vous souhaitez mettre jour. Lobjectif est de mettre jour les donnes client en fonction de leur ID. Ainsi, cochez toutes les cases sauf celle correspondant la colonne ID.

Les colonnes dfinies comme cl primaire NE PEUVENT PAS et NE DOIVENT PAS faire lobjet dune mise jour.

Guide de Rfrence des Composants Talend Open Studio

1003

Scnario : Utiliser la fonction MERGE dOracle pour mettre jour et insrer simultanment des donnes

Cochez la case Use Merge Insert afin d'insrer de nouvelles donnes lors de la mise jour des donnes existantes en utilisant la fonction MERGE d'Oracle. Dans le tableau qui apparat, cochez la case des colonnes dans lesquelles vous souhaitez insrer une nouvelle date. Dans ce scnario, vous allez insrer de nouvelles donnes client. Cochez donc toutes les cases en cliquant sur la case Check All. Renseignez le champ Default Table Name en saisissant le nom de la table cible dj existante dans votre base de donnes. Dans cet exemple, saisissez customers_merge. Laissez les autres paramtres tels qu'ils sont.

Enregistrez votre Job et appuyez sur F6 pour lexcuter. Les donnes sont mises jour et insres dans la base de donnes. La requte utilise est affiche dans la console.

1004

Guide de Rfrence des Composants Talend Open Studio

tELTPostgresqlInput

tELTPostgresqlInput

Proprits de tELTPostgresqlInput
Les composants tELTPostgresqlInput, tELTPostgresqlOutput, et tELTPostgresqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Postgresql afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif Basic settings ELT/Map/Postgresql Fournit le schma de la table dentre la commande SQL qui sera excute. Permet dajouter autant de tables que ncessaires dans une commande Insert qui peut tre complexe. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Le schma dfini est ensuite pass au composant ELT Mapper afin de lutiliser dans la commande SQL Insert Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Default Table Name Default Schema Name Advanced settings Utilisation tStatCatcher Statistics Saisissez le nom de la table par dfaut. Saisissez le nom du schma par dfaut. Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTPostgresqlInput est troitement lie celle du tELTPostrgesqlMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant un composant semblable au tELTPostgresqlInput, consultez les scnarios suivants du composant tELTPostgresqlMap :

Guide de Rfrence des Composants Talend Open Studio

1005

Scnarios associs

la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

1006

Guide de Rfrence des Composants Talend Open Studio

tELTPostgresqlMap

tELTPostgresqlMap

Proprits de tELTPostgresqlMap
Les composants tELTPostgresqlInput, tELTPostgresqlOutput et tELTPostgresqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Postgresql afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif ELT/Map/Postgresql Permet de construire votre commande SQL graphiquement en utilisant la table fournie en entre. Utilise les tables fournies en entre pour alimenter les paramtres ncessaires lexcution de la commande SQL souhaite. La commande peut contenir des jointures internes comme externes entre diffrentes tables ou entre une table et ses alias. Use an existing connec- Cochez cette case et slectionnez le composant tPostgrestion qlConnection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. ELT Postgresql Map Lditeur ELT du Mapper vous permet de dfinir le schEditor ma de sortie ainsi que de construire graphiquement la commande SQL excuter. Le nom des colonnes du schma peut tre diffrent du nom des colonnes dans la base de donnes. Style link Slectionnez le type daffichage des liens.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1007

Scnarios associs

Auto : par dfaut, les liens entre les schmas dentre et de sortie et les paramtres du service Web sont en forme de courbe. Curves : les liens entre les schmas et les paramtres du service Web sont en forme de ligne. Line : les liens entre les schmas et les paramtres du service Web sont en forme de lignes droites. Cette option vous permettra doptimiser les performances. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Advanced settings Adresse IP du serveur de base de donnes Numro de port dcoute du serveur de la base. Nom de la base de donnes

Username et Password Donnes dauthentification de lutilisateur de la base Additional JDBC para- Spcifiez des informations supplmentaires de connexion meters la base de donnes cre. Cette option n'est pas disponible lorsque vous utilisez l'option Use an existing connection dans les Basic settings. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTPostgresqlMap est troitement lie celle des composants tELTPostgresqlInput et tELTPostgresqlOutput. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios associs, consultez les scnarios suivants du composant tELTMysqlMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

1008

Guide de Rfrence des Composants Talend Open Studio

tELTPostgresqlOutput

tELTPostgresqlOutput

Proprits de tELTPostgresqlOutput
Les composants tELTPostgresqlInput, tELTPostgresqlOutput, et tELTPostgresqlMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Postgresql afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille du composant Fonction Objectif Basic settings ELT/Map/Postgresql Effectue laction sur la table telle que spcifie et insre les donnes selon le schma de sortie dfini dans le Mapper ELT. Excute la requte Insert dans la base de donnes Postgresql. Action on data Sur les donnes de la table dfinie, vous pouvez effectuer les oprations suivantes : Insert : Ajoute de nouvelles lignes la table. Si des doublons sont identifis, le Job sarrte. Update : Met jour des lignes existantes. Delete : Supprime les entres correspondantes au flux dentre. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Where clauses for (for Saisissez la clause permettant de filtrer les donnes UPDATE and DELETE mettre jour ou supprimer lors des oprations de mise only) jour ou de suppression. Default Table Name Default Schema Name Saisissez le nom de la table par dfaut. Saisissez le nom du schma par dfaut.

Use different table name Cochez cette case afin de dfinir le nom dune table de sortie diffrente, entre guillemets doubles, dans le champ Table name qui apparat. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTPostgresqlOutput est troitement lie celle des composants tELTPostgresqlInput et tELTPostgresqlMap. Notez que le lien de

Guide de Rfrence des Composants Talend Open Studio

1009

Scnarios associs

sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant un composant semblable au tELTPostgresqlOutput, consultez les scnarios suivants du composant tELTMysqlMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

1010

Guide de Rfrence des Composants Talend Open Studio

tELTSybaseInput

tELTSybaseInput

Proprits de tELTSybaseInput
Les composants tELTSybaseInput, tELTSybaseOutput, et tELTSybaseMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Sybase afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif Basic settings ELT/Map/Sybase Fournit le schma de la table dentre la commande SQL qui sera excute. Permet dajouter autant de tables que ncessaires dans une commande Insert qui peut tre complexe. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Le schma dfini est ensuite pass au composant ELT Mapper afin de lutiliser dans la commande SQL Insert Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Default Table Name Default Schema Name Advanced settings Utilisation tStatCatcher Statistics Saisissez le nom de la table par dfaut. Saisissez le nom du schma Sybase par dfaut. Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTSybaseInput est troitement lie celle du tELTSybaseMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant le composant tELTSybaseInput, consultez les scnarios suivants du composant tELTMysqlMap :

Guide de Rfrence des Composants Talend Open Studio

1011

Scnarios associs

la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

1012

Guide de Rfrence des Composants Talend Open Studio

tELTSybaseMap

tELTSybaseMap

Proprits de tELTSybaseMap
Les composants tELTSybaseInput, tELTSybaseOutput, et tELTSybaseMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Sybase afin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif ELT/Map/Sybase Permet de construire votre commande SQL graphiquement en utilisant la table fournie en entre. Utilise les tables fournies en entre pour alimenter les paramtres ncessaires lexcution de la commande SQL souhaite. La commande peut contenir des jointures internes comme externes entre diffrentes tables ou entre une table et ses alias. Use an existing connec- Cochez cette case et slectionnez le composant tSybasetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. ELT Sybase Map Editor Lditeur ELT du Mapper vous permet de dfinir le schma de sortie ainsi que de construire graphiquement la commande SQL excuter. Le nom des colonnes du schma peut tre diffrent du nom des colonnes dans la base de donnes. Style link Slectionnez le type daffichage des liens.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1013

Scnarios associs

Auto : par dfaut, les liens entre les schmas dentre et de sortie et les paramtres du service Web sont en forme de courbe. Bezier curve : les liens entre les schmas et les paramtres du service Web sont en forme de ligne. Line : les liens entre les schmas et les paramtres du service Web sont en forme de lignes droites. Cette option vous permettra doptimiser les performances. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Advanced settings Utilisation tStatCatcher Statistics Adresse IP du serveur de base de donnes Numro de port dcoute du serveur de la base. Nom de la base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Username et Password Donnes dauthentification de lutilisateur de la base.

Lutilisation du composant tELTSybaseMap est troitement lie celle des composants tELTSybaseInput et tELTSybaseOutput. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios associs, consultez les scnarios suivants du composant tELTMysqlMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

1014

Guide de Rfrence des Composants Talend Open Studio

tELTSybaseOutput

tELTSybaseOutput

Proprits de tELTSybaseOutput
Les composants tELTSybaseInput, tELTSybaseOutput, et tELTSybaseMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Sybase fin de gnrer des commandes Insert, y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille du composant Fonction Objectif Basic settings Utilisez le composant tCreateTable pour remplacer cette option. ELT/Map/Sybase Effectue laction sur la table telle que spcifie et insre les donnes selon le schma de sortie dfini dans le Mapper ELT. Excute la requte Insert dans la base de donnes Sybase. Action on data Sur les donnes de la table dfinie, vous pouvez effectuer les oprations suivantes : Insert : Ajoute de nouvelles lignes la table. Si des doublons sont identifis, le Job sarrte. Update : Met jour des lignes existantes. Delete : Supprime les entres correspondantes au flux dentre. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Where clauses for (for Saisissez la clause permettant de filtrer les donnes UPDATE and DELETE mettre jour ou supprimer lors des oprations de mise only) jour ou de suppression. Default Table Name Default Schema Name Saisissez le nom de la table par dfaut. Saisissez le nom du schma Sybase par dfaut.

Use different table name Cochez cette case afin de dfinir le nom dune table de sortie diffrente, entre guillemets doubles, dans le champ Table name qui apparat. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTSybaseOutput est troitement lie celle des composants tELTSybaseInput et tELTSybaseMap. Notez que le lien de sortie

Guide de Rfrence des Composants Talend Open Studio

1015

Scnarios associs

(output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios associs, consultez les scnarios suivants du composant tELTMysqlMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

1016

Guide de Rfrence des Composants Talend Open Studio

tELTTeradataInput

tELTTeradataInput

Proprits de tELTTeradataInput
Les composants tELTTeradataInput, tELTTeradataOutput, et tELTTeradataMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Teradata afin de gnrer des commandes Insert y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif Basic settings ELT/Map/Teradata Fournit le schma de la table dentre la commande SQL qui sera excute. Permet dajouter autant de tables que ncessaires dans une commande Insert qui peut tre complexe. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Le schma dfini est ensuite pass au composant ELT Mapper afin de lutiliser dans la commande SQL Insert Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Default Table Name Advanced settings Utilisation tStatCatcher Statistics Saisissez le nom par dfaut de la table, entre guillemets doubles. Cochez cette case pour collecter les donnes de log au niveau du composant.

Lutilisation du composant tELTTeradataInput est troitement lie celle du tELTTeradataMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios utilisant le composant tELTTeradataInput, consultez les scnarios suivants du tELTTeradataMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre .

Guide de Rfrence des Composants Talend Open Studio

1017

Scnarios associs

la section intitule Scnario 2 : ELT utilisant une table Alias .

1018

Guide de Rfrence des Composants Talend Open Studio

tELTTeradataMap

tELTTeradataMap

Proprits de tELTTeradataMap
Les composants tELTTeradataInput, tELTTeradataOutput, et tELTTeradataMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Teradata afin de gnrer des commandes Insert y compris des clauses, et ces commandes devront tre excutes dans la table de sortie dfinie. Famille de composant Fonction Objectif ELT/Map/Teradata Permet de construire votre commande SQL graphiquement en utilisant la table fournie en entre. Utilise les tables fournies en entre pour alimenter les paramtres ncessaires lexcution de la commande SQL souhaite. La commande peut contenir des jointures internes comme externes entre diffrentes tables ou entre une table et ses alias. Use an existing connec- Cochez cette case et slectionnez le composant tSybasetion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide utilisateur de votre Studio. ELT Teradata Map edi- Lditeur ELT du Mapper vous permet de dfinir le schtor ma de sortie ainsi que de construire graphiquement la commande SQL excuter. Le nom des colonnes du schma peut tre diffrent du nom des colonnes dans la base de donnes. Style link Slectionnez le type daffichage des liens.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1019

Proprits de tELTTeradataMap

Auto : par dfaut, les liens entre les schmas dentre et de sortie et les paramtres du service Web sont en forme de courbe. Bezier curve : les liens entre les schmas et les paramtres du service Web sont en forme de ligne. Line : les liens entre les schmas et les paramtres du service Web sont en forme de lignes droites. Cette option vous permettra doptimiser les performances. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Database Utilisation Adresse IP du serveur de base de donnes Numro de port dcoute du serveur de la base. Nom de la base de donnes

Username et Password Donnes dauthentification de lutilisateur de la base Lutilisation du composant tELTTeradataMap est troitement lie celle des composants tELTTeradataInput et tELTTeradataOutput. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Connecter les composants ELT


Pour plus dinformations concernant la connexion des composants ELT, consultez la section intitule Connecter les composants ELT Voir galement le Guide utilisateur de Talend Open Studio

Tables de jointure et de correspondance


Dans le Mapper ELT, vous pouvez slectionner des colonnes des schmas dentre et les intgrer dans le schma de sortie. Pour plus dinformations concernant la mise en correspondance et les jointures, consultez la section intitule Tables de jointure et de correspondance

Ajouter des clauses Where


Pour plus dinformations sur la manipulation des clauses, consultez la section intitule Ajouter des clauses WHERE

1020

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Gnrer la requte SQL


La mise en correspondance dlments des schmas dentre avec le schma de sortie cre automatiquement la requte Select correspondante. La/les clause(s) dfinie(s) dans le mapper ELT est (sont) galement intgre(s) automatiquement dans la requte.

Scnarios associs
Pour des scnarios associs, consultez les scnarios suivants du composant tELTMysqlMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

1021

tELTTeradataOutput

tELTTeradataOutput

Proprits de tELTTeradataOutput
Les composants tELTTeradataInput, tELTTeradataOutput, et tELTTeradataMap sont trs proches dans leurs conditions de fonctionnement. En effet, ces trois composants sont conus pour manipuler des schmas de donnes dune base Teradata afin de gnrer des commandes Insert y compris des clauses, qui devront tre excutes dans la table de sortie dfinie. Famille du composant Fonction Objectif Basic settings ELT/Map/Teradata Effectue laction sur la table telle que spcifie et insre les donnes selon le schma de sortie dfini dans le Mapper ELT. Excute la requte Insert ou Update dans la base de donnes Teradata Action on data Sur les donnes de la table dfinie, vous pouvez effectuer les oprations suivantes : Insert : Ajoute de nouvelles lignes la table. Si des doublons sont identifis, le Job sarrte. Update : Met jour des lignes existantes. Delete : Supprime les entres correspondantes au flux dentre. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Where clauses for (for Saisissez la clause permettant de filtrer les donnes UPDATE and DELETE mettre jour ou supprimer lors des oprations de mise only) jour ou de suppression. Default Table Name Saisissez le nom par dfaut de la table, entre guillemets doubles.

Use different table name Cochez cette case afin de dfinir le nom dune table de sortie diffrente, entre guillemets doubles, dans le champ Table name qui apparat. Advanced settings tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

1022

Guide de Rfrence des Composants Talend Open Studio

Scnarios associs

Utilisation

Lutilisation du composant tELTTeradataOutput est troitement lie celle des composants tELTTeradataInput et tELTTeradataMap. Notez que le lien de sortie (output) utiliser avec ces deux composants doit respecter strictement la syntaxe du nom de la table. Les composants ELT ne traitent pas le flux de donnes lui-mme mais uniquement les informations du schma.

Scnarios associs
Pour des scnarios associs, consultez les scnarios suivants du composant tELTMysqlMap : la section intitule Scnario 1 : Agrger les colonnes dune table et appliquer un filtre . la section intitule Scnario 2 : ELT utilisant une table Alias .

Guide de Rfrence des Composants Talend Open Studio

1023

tSQLTemplateAggregate

tSQLTemplateAggregate

Proprits du tSQLTemplateAggregate
Famille de composant Fonction ELT/SQLTemplate Le composant tSQLTemplateAggregate collecte les donnes dune ou plusieurs colonnes et gre ces donnes en un seul bloc. Ce composant excute en temps rel des transformations de donnes dans le SGBD lui-mme. Il permet dtablir des mtriques bases sur des valeurs ou des calculs. Database Type Component List Slectionnez dans le menu droulant le type de base de donnes sur lequel vous voulez travailler. Slectionnez le composant de connexion la base de donnes dans la liste si vous utilisez plus dune connexion dans le Job en cours. Nom de la base de donnes. Nom de la table contenant les donnes dont vous souhaitez collecter les donnes. Nom de la table dans laquelle vous souhaitez crire les donnes collectes et transformes.

Objectif Basic settings

Database name Source table name Target table name

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Operations Slectionnez le type dopration et la valeur utiliser pour le calcul et le champ de sortie. Output Column : Slectionnez le champ de destination dans la liste. Function : Slectionnez une des oprations suivantes effectuer sur les donnes : count : calcule le nombre de lignes, min : slectionne la plus petite valeur, max : slectionne la plus grande valeur,

1024

Guide de Rfrence des Composants Talend Open Studio

Proprits du tSQLTemplateAggregate

avg : calcule la moyenne, sum : calcule la somme, count (distinct) : compte le nombre de lignes sans les doublons. Input column position : Slectionnez la colonne dentre partir de laquelle vous souhaitez collecter les donnes agrger. Group by Dfinit les ensembles dagrgation, dont les valeurs sont utilises pour les calculs. Output Column : Slectionnez le libell de colonne dans la liste fournie, base sur la structure de schma que vous avez dfinie. Vous pouvez ajouter autant de colonnes de sortie que vous le souhaitez afin daffiner les agrgations. Input Column position : Faites la correspondance entre les libells des colonnes dentre avec ceux des colonnes de sortie, dans le cas o vous souhaitez que les libells du schma de sortie soient diffrents du schma dentre. Advanced settings SQL Template tStatCatcher Statistics SQLTemplate List Cochez cette case pour collecter les donnes de log au niveau du composant. Cliquez sur le bouton Add pour ajouter un ou plusieurs modle SQL du systme la liste SQLTemplateList. Cliquez dans la cellule de la colonne SQLTemplate List que vous venez dajouter et slectionnez le modle SQL du systme adquat dans la liste de modles fournis par Talend. Note : Vous pouvez crer vos propres modles SQL et les ajouter la liste SQLTemplate List. Pour crer un nouveau modle SQL : 1- Slectionnez un modle dj existant dans la liste SQLTemplate list et cliquez dans son code dans le champ de code. Une bote de dialogue souvrira vous demandant de crer un nouveau modle. 2- Cliquez sur Yes pour ouvrir la bote de dialogue New SQLTemplate. 3- Renseignez les informations de votre modle SQL et cliquez sur Finish pour fermer la bote de dialogue. Un diteur de modle SQL apparat dans lequel vous pouvez saisir votre code. 4- Cliquez sur le bouton Add pour ajouter le nouveau modle dans la liste SQLTemplate list. Pour plus dinformations, consultez le Guide Utilisateur de Talend Open Studio. Utilisation Ce composant est un composant intermdiaire. Vous pouvez lutiliser avec dautres composants de base de donnes, notamment les composants de connexion et de commit.

Guide de Rfrence des Composants Talend Open Studio

1025

Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD

Limitation

n/a

Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD
Le scnario suivant cre un Job qui ouvre une connexion une base de donnes Mysql et : cre un schma partir de la table dune base de donnes, les lignes de ce schma correspondent aux noms des colonnes spcifies dans le filtre, filtre les colonnes de cette mme table afin de nobtenir que les donnes correspondant aux colonnes filtres, collecte les donnes de la colonne filtre, regroupes en fonction dune valeur spcifique et crit les donnes agrges dans la table de cible. Pour filtrer et agrger les colonnes de la table de votre base de donnes : Cliquez et dposez les composants suivants dans lespace de modlisation : tELTMysqlconnection, tSQLTemplateFilterColumns, tSQLTemplateFilterRows, tSQLTemplateAggregate, tSQLTemplateCommit et tSQLTemplateRollback. Connectez les cinq composants laide de liens de type OnComponentOk. Connectez les composants tSQLTemplateAggregate et tSQLTemplateRollback laide dun lien de type OnComponentError.

Dans lespace de modlisation, slectionnez le tMysqlConnection et cliquez sur la vue Component pour paramtrer ses proprits. Dans longlet Basic settings, renseignez manuellement les informations de connexion ou slectionnez-les partir des variables de contexte, via la raccourci Ctrl+Espace cliquez sur le champ correspondant si les vous avez stock sous le nud DB connection du rpertoire Metadata du Repository. Pour plus dinformations sur les mtadonnes, consultez le Guide utilisateur de Talend Open Studio.

1026

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD

Dans lespace de modlisation, slectionnez le composant tSQLTemplateFilterColumns et cliquez sur la vue Component pour paramtrer ses proprits.

Dans la liste droulante Database type, slectionnez la base de donnes adquate. Dans la liste droulante Component list, slectionnez le composant de connexion la base de donnes si plusieurs composants de connexion sont utiliss dans votre Job. Dans le champ Database name, saisissez le nom de la base de donnes laquelle vous vous tes connect. Dans le champ Source table name, saisissez le nom de votre table source contenant les donnes que vous souhaitez traiter et cliquez sur le bouton [...] ct du champ Edit schema pour dfinir la structure des donnes de votre table source. Dans le champ Target table name, saisissez le nom de la table cible contenant vos nouvelles donnes traites et cliquez sur le bouton [...] ct du champ Edit schema pour dfinir la structure de la table cible. Lorsque vous dfinissez la structure des donnes de la table source, le nom des colonnes apparat automatiquement dans la colonne Column du tableau Column filters. Dans ce scnario, la table source contient les cinq colonnes : id, First_Name, Last_Name, Address et id_State. Dans le tableau Column filters, filtrez les colonnes en cochant la case des colonnes que vous souhaitez crire dans votre table cible. Dans ce scnario, le composant tSQLTemplateFilterColumns ne garde que les colonnes id, First_Name et id_State de la table source. Dans la vue Component, vous pouvez cliquer sur longlet SQL Template et ajouter des modles SQL du systme ou crer vos propres modles SQL et les utilisez dans votre Job afin deffectuer les oprations que vous souhaitez. Pour plus dinformations, consultez la section intitule Proprits du tSQLTemplateFilterColumns Dans lespace de modlisation, slectionnez le composant tSQLTemplateFilterRows et cliquez sur longlet Component pour paramtrer ses proprits.

Guide de Rfrence des Composants Talend Open Studio

1027

Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD

Dans la liste droulante Database type, slectionnez la base de donnes adquate. Dans la liste droulante Component list, slectionnez le composant de connexion la base de donnes si plusieurs composants de connexion sont utiliss dans votre Job. Dans le champ Database name, saisissez le nom de la base de donnes laquelle vous vous tes connect. Dans le champ Source table name, saisissez le nom de votre table source contenant les donnes que vous souhaitez traiter et cliquez sur le bouton [...] ct du champ Edit schema pour dfinir la structure des donnes de votre table source. Dans le champ Target table name, saisissez le nom de la table cible contenant vos nouvelles donnes traites et cliquez sur le bouton [...] ct du champ Edit schema pour dfinir la structure de la table cible. Dans ce scnario, la table source et la table cible contiennent les trois colonnes filtres id, First_Name et id_State. Dans le champ Where condition, saisissez la commande WHERE vous permettant de nextraire que les champs correspondant vos critres. Dans ce scnario, le composant tSQLTemplateFilterRows filtre la colonne First_Name de la table source pour nobtenir que les prnoms commencent par la lettre a. Dans lespace de modlisation, slectionnez le composant tSQLTemplateAggregate et cliquez sur la vue Component pour paramtrer ses proprits. Dans la liste droulante Database type, slectionnez la base de donnes adquate. Dans la liste Component list, slectionnez le composant de connexion la base de donnes si plusieurs composants de connexion sont utiliss dans votre Job. Dans le champ Database name, saisissez le nom de la base de donnes laquelle vous vous tes connect. Dans le champ Source table name, saisissez le nom de votre table source contenant les donnes que vous souhaitez traiter et cliquez sur le bouton [...] ct du champ Edit schema pour dfinir la structure des donnes de votre table source. Dans le champ Target table name, saisissez le nom de la table cible contenant vos nouvelles donnes traites et cliquez sur le bouton [...] ct du champ Edit schema pour dfinir la structure de la table cible. Le schma de la table source est compos de trois colonnes : id, First_Name et id_State. Le schma de la table cible est compos de deux colonnes : customers_status et customers_number. Dans ce scnario, vous souhaitez regrouper les clients par statut marital et compter le nombre de client pour chaque groupe marital. Pour cela, renseignez les tableaux Operations et Group by.

1028

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD

Dans le tableau Operations, cliquez sur le bouton [+] pour ajouter une ou plusieurs lignes et cliquez dans la cellule de la colonne Output column et slectionnez la colonne de sortie qui contiendra les donnes compter. Cliquez dans la cellule de la colonne Function et slectionnez lopration effectuer. Dans le tableau Group by, cliquez sur le bouton [+] pour ajouter une ou plusieurs lignes et cliquez dans la cellule de la colonne Output column pour slectionner la colonne de sortie qui contiendra les donnes agrges. Dans lespace de modlisation, slectionnez le composant tSQLTemplateCommit et cliquez sur la vue Component pour paramtrer ses proprits. Dans la liste droulante Database type, slectionnez la base de donnes adquate. Dans la liste droulante Component list, slectionnez le composant de connexion la base de donnes si plusieurs composants de connexion sont utiliss dans votre Job. Effectuez la mme procdure pour le composant tSQLTemplateRollback. Enregistrez le Job et appuyez sur F6 pour lexcuter. La table aggregate_customers compose de deux colonnes est cre dans la base de donnes. Elle regroupe les clients en fonction de leur statut marital et compte le nombre de client pour chaque statut marital.

Guide de Rfrence des Composants Talend Open Studio

1029

tSQLTemplateCommit

tSQLTemplateCommit

Proprits du tSQLTemplateCommit
Ce composant est troitement li au composant tSQLTemplateRollback et au composant ELT de connexion la base de donnes sur laquelle vous travaillez. Ils sont gnralement utiliss ensemble lors de transactions. Famille du composant Fonction Objectif ELT/SQLTemplate Le composant tSQLTemplateCommit valide les donnes traites dans un Job partir dune base de donnes connecte. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Database Type Component List Slectionnez dans le menu droulant le type de base de donnes sur lequel vous voulez travailler. Sil y a plus dune connexion dans le Job en cours, slectionnez le composant de connexion la base de donnes que vous utilisez dans la liste. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant. Cliquez sur le bouton Add pour ajouter un ou plusieurs modle SQL du systme la liste SQLTemplateList. Cliquez dans la cellule de la colonne SQLTemplate List que vous venez dajouter et slectionnez le modle SQL du systme adquat dans la liste de modles fournis par Talend. Note : Vous pouvez crer vos propres modles SQL et les ajouter la liste SQLTemplate List. Pour crer un nouveau modle SQL : 1- Slectionnez un modle dj existant dans la liste SQLTemplate list et cliquez dans son code dans le champ de code. Une bote de dialogue souvrira vous demandant de crer un nouveau modle. 2- Cliquez sur Yes pour ouvrir la bote de dialogue New SQLTemplate. 3- Renseignez les informations de votre modle SQL et cliquez sur Finish pour fermer la bote de dialogue. Un diteur de modle SQL apparat dans lequel vous pouvez saisir votre code. 4- Cliquez sur le bouton Add pour ajouter le nouveau modle dans la liste SQLTemplate list.

Basic settings

Close Connection Advanced settings SQL Template tStatCatcher Statistics SQLTemplate List

1030

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Pour plus dinformations, consultez le Guide Utilisateur de Talend Open Studio. Utilisation Ce composant est gnralement utilis avec des composants ELT et notamment avec le composant tSQLTemplateRollback, ainsi quavec le composant ELT de connexion la base de donnes que vous utilisez. n/a

Limitation

Scnario associ
Ce composant est troitement li au composant tSQLTemplateRollback et au composant ELT de connexion la base de donnes avec laquelle vous travaillez. Ils sont gnralement utiliss avec le composant ELT de connexion correspondant car il permet douvrir une connexion pour la transaction en cours. Pour plus dinformations relatives au fonctionnement du composant tSQLTemplateCommit, consultez la section intitule Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD

Guide de Rfrence des Composants Talend Open Studio

1031

tSQLTemplateFilterColumns

tSQLTemplateFilterColumns

Proprits du tSQLTemplateFilterColumns
Famille de composant Fonction ELT/SQLTemplate Le composant tSQLTemplateFilterColumns modifie le schma de la table dune base de donnes en filtrant les colonnes. Ce composant filtre en temps rel les donnes dans le SGBD lui-mme. Il permet dhomogniser des schmas en rorganisant ou en supprimant des colonnes ou en ajoutant de nouvelles colonnes. Database Type Component List Slectionnez dans le menu droulant le type de base de donnes sur lequel vous voulez travailler. Slectionnez le composant de connexion la base de donnes si vous utilisez plus dune connexion dans votre Job en cours. Nom de la base de donnes. Nom de la table contenant les donnes filtrer. Nom de la table dans laquelle vous souhaitez crire les donnes filtres.

Objectif Basic settings

Database name Source table name Target table name

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Column filters Dans le tableau, cochez la case Filter pour filtrer toutes vos colonnes, ou, pour en filtrer moins, cliquez sur la ou les case(s) en face du nom de la ou des colonne(s). Cochez cette case pour collecter les donnes de log au niveau du composant. Cliquez sur le bouton Add pour ajouter un ou plusieurs modle SQL du systme la liste SQLTemplateList. Cliquez dans la cellule de la colonne SQLTemplate List que vous venez dajouter et slectionnez le modle SQL du systme adquat dans la liste de modles fournis par Talend.

Advanced settings SQL Template

tStatCatcher Statistics SQLTemplate List

1032

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Note : Vous pouvez crer vos propres modles SQL et les ajouter la liste SQLTemplate List. Pour crer un nouveau modle SQL : 1- Slectionnez un modle dj existant dans la liste SQLTemplate list et cliquez dans son code dans le champ de code. Une bote de dialogue souvrira vous demandant de crer un nouveau modle. 2- Cliquez sur Yes pour ouvrir la bote de dialogue New SQLTemplate. 3- Renseignez les informations de votre modle SQL et cliquez sur Finish pour fermer la bote de dialogue. Un diteur de modle SQL apparat dans lequel vous pouvez saisir votre code. 4- Cliquez sur le bouton Add pour ajouter le nouveau modle dans la liste SQLTemplate list. Pour plus dinformations, consultez le Guide Utilisateur de Talend Open Studio. Utilisation Ce composant est un composant intermdiaire. Vous pouvez lutiliser avec dautres composants de base de donnes, notamment les composants de connexion et de commit. n/a

Limitation

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD .

Guide de Rfrence des Composants Talend Open Studio

1033

tSQLTemplateFilterRows

tSQLTemplateFilterRows

Proprits du tSQLTemplateFilterRows
Famille de composant Fonction Objectif Basic settings ELT/SQLTemplate Le composant tSQLTemplateFilterRows vous permet de filtrer les lignes dune table. Ce composant filtre en temps rel les donnes dans le SGBD lui-mme. Il permet de mettre en place un filtrage de lignes sur nimporte quelle donne source grce une commande WHERE. Database Type Component List Slectionnez dans le menu droulant le type de base de donnes sur lequel vous voulez travailler. Slectionnez le composant de connexion la base de donnes si vous utilisez plus dune connexion dans le Job en cours. Nom de la base de donnes. Nom de la table contenant les donnes filtrer. Nom de la table dans laquelle vous souhaitez crire les donnes filtres.

Database name Source table name Target table name

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Where condition Utilisez une commande WHERE pour dfinir un critre partir duquel vous souhaitez filtrer vos donnes. Vous pouvez utiliser la commande WHERE pour slectionner des lignes spcifiques de votre table en fonction de certains critres ou certaines conditions. Advanced settings SQL Template tStatCatcher Statistics SQLTemplate List Cochez cette case pour collecter les donnes de log aussi bien au niveau du Job quau niveau du composant. Cliquez sur le bouton Add pour ajouter un ou plusieurs modle SQL du systme la liste SQLTemplateList. Cliquez dans la cellule de la colonne SQLTemplate List que vous venez dajouter et slectionnez le modle SQL du systme adquat dans la liste de modles fournis par Talend.

1034

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Note : Vous pouvez crer vos propres modles SQL et les ajouter la liste SQLTemplate List. Pour crer un nouveau modle SQL : 1- Slectionnez un modle dj existant dans la liste SQLTemplate list et cliquez dans son code dans le champ de code. Une bote de dialogue souvrira vous demandant de crer un nouveau modle. 2- Cliquez sur Yes pour ouvrir la bote de dialogue New SQLTemplate. 3- Renseignez les informations de votre modle SQL et cliquez sur Finish pour fermer la bote de dialogue. Un diteur de modle SQL apparat dans lequel vous pouvez saisir votre code. 4- Cliquez sur le bouton Add pour ajouter le nouveau modle dans la liste SQLTemplate list. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio. Utilisation Ce composant est un composant intermdiaire. Vous pouvez lutiliser avec dautres composants de base de donnes, notamment les composants de connexion et de commit. n/a

Limitation

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD .

Guide de Rfrence des Composants Talend Open Studio

1035

tSQLTemplateMerge

tSQLTemplateMerge

Proprits du tSQLTemplateMerge
Famille de composant Fonction Objectif ELT/SQLTemplate Le composant tSQLTemplateMerge cre une instruction SQL MERGE sur les donnes dans une table de la base de donnes. Ce composant est utilis pour effectuer des oprations de MERGE sur les donnes (insertion, mise jour ou suppression) directement dans une table du SGBD. Pour cela, il cre et excute une instruction MERGE. Database Type Component list Slectionnez dans le menu droulant le type de base de donnes sur lequel vous voulez travailler. Slectionnez le composant ELT de connexion le plus pertinent dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Nom de la table contenant les donnes sur lesquelles vous souhaitez effectuer les oprations dinsertion ou de mise jour dans la table cible. Nom de la table dans laquelle vous souhaitez effectuer les oprations dinsertion ou de mise jour.

Basic settings

Source table name

Target table name

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Merge ON Spcifiez les colonnes source et cible que vous souhaitez utiliser comme cls primaires.

Use UPDATE (WHEN Cochez cette case pour mettre jour les enregistrements MATCHED) existants. Une fois cette case coche, la table UPDATE Columns apparat, vous permettant de dfinir les colonnes dans lesquelles les enregistrements seront mis jour. Specify additional out- Cochez cette case pour mettre jour les enregistrements put columns dans des colonnes autres que celles listes dans la table UPDATE Columns. Une fois cette case coche, la table Additional UPDATE Columns apparat, vous permettant de dfinir des colonnes supplmentaires.

1036

Guide de Rfrence des Composants Talend Open Studio

Proprits du tSQLTemplateMerge

Specify UPDATE Cochez cette case et saisissez une clause de type WHERE WHERE clause dans le champ WHERE clause afin de filtrer les donnes lors de lopration de mise jour. Il est probable que cette option ne fonctionne pas avec certaines versions des bases de donnes, notamment Oracle 9i. Use INSERT (WHEN Cochez cette case pour insrer de nouveaux enregistreMATCHED) ments. Une fois cette case coche, la table INSERT Columns apparat, vous permettant de dfinir des colonnes to be involved in the insert operation. Specify additional out- Cochez cette case pour insrer des enregistrements dans put columns les colonnes des colonnes autres que celles listes dans la table INSERT Columns. Une fois cette case coche, la table Additional INSERT Columns apparat, vous permettant de dfinir des colonnes supplmentaires. Specify INSERT Cochez cette case et saisissez une clause de type WHERE WHERE clause dans le champ WHERE clause fin de filtrer les donnes lors de lopration dinsertion. Il est probable que cette option ne fonctionne pas avec certaines versions des bases de donnes, notamment Oracle 9i. Advanced settings SQL Template tStatCatcher Statistics SQL Template List Cochez cette case pour collecter les donnes de log aussi bien au niveau du Job quau niveau du composant. Cliquez sur le bouton Add pour ajouter un ou plusieurs modle SQL du systme la liste SQLTemplateList. Cliquez dans la cellule de la colonne SQLTemplate List que vous venez dajouter et slectionnez le modle SQL du systme adquat dans la liste de modles fournis par Talend. Note : Vous pouvez crer vos propres modles SQL et les ajouter la liste SQLTemplate List. Pour crer un nouveau modle SQL : 1- Slectionnez un modle dj existant dans la liste SQLTemplate list et cliquez dans son code dans le champ de code. Une bote de dialogue souvrira vous demandant de crer un nouveau modle. 2- Cliquez sur Yes pour ouvrir la bote de dialogue New SQLTemplate. 3- Renseignez les informations de votre modle SQL et cliquez sur Finish pour fermer la bote de dialogue. Un diteur de modle SQL apparat dans lequel vous pouvez saisir votre code. 4- Cliquez sur le bouton Add pour ajouter le nouveau modle dans la liste SQLTemplate list.

Guide de Rfrence des Composants Talend Open Studio

1037

Scnario : Effectuer des oprations de MERGE directement dans le SGBD

Pour plus dinformations, consultez le Guide Utilisateur de Talend Open Studio. Utilisation Ce composant est un composant intermdiaire. Vous pouvez lutiliser avec dautres composants de base de donnes, notamment les composants de connexion et de commit.

Scnario : Effectuer des oprations de MERGE directement dans le SGBD


Ce scnario dcrit un Job simple permettant douvrir une connexion une base de donnes MySQL, deffectuer des oprations dinsertion ou de mise jour sur les donnes dune table source vers une table cible en fonction de lidentifiant de lutilisateur et dafficher le contenu de la table cible avant et aprs les oprations de MERGE. Une clause de type WHERE est utilise pour filtrer les donnes lors de ces oprations.

A partir de la Palette, dposez les composants suivants dans lespace de modlisation graphique : un tMysqlConnection, un tSQLTemplateMerge, deux tMysqlInput et deux tLogRow. Connectez le composant tMysqlConnection au premier tMysqlInput laide dun lien Trigger > OnSubjobOK. Connectez le premier tMysqlInput au premier tLogRow laide dun lien Row > Main. Cette ligne affichera le contenu initial de la table cible dans la console de la vue Run. Connectez le premier tMysqlInput au composant tSQLTemplateMerge, et le tSQLTemplateMerge au second composant tMysqlInput laide de connexions Trigger > OnSubjobOK. Connectez le second tMysqlInput au second tLogRow laide dun lien Row > Main. Cette ligne affichera le rsultat des oprations de MERGE dans la console de la vue Run. Double-cliquez sur le composant tMysqlConnection pour afficher longlet Basic settings de sa vue Component.

1038

Guide de Rfrence des Composants Talend Open Studio

Scnario : Effectuer des oprations de MERGE directement dans le SGBD

Paramtrez manuellement les dtails de la connexion la base de donnes ou slectionnez Repository dans la liste Property Type et slectionnez votre connexion une base de donnes si celle-ci a dj t dfinie et stocke dans la zone Metadata de la vue Repository. Pour plus dinformations concernant les Mtadonnes, consultez le Guide utilisateur de Talend Open Studio. Double-cliquez sur le premier composant tMysqlInput pour afficher longlet Basic settings de sa vue Component.

Cochez la case Use an existing connection. Si vous souhaitez utiliser plus dun composant de connexion dans votre Job, slectionnez le composant que vous souhaitez utiliser partir de la liste Component List. Cliquez sur le bouton [...] ct de Edit schema et dfinissez la structure des donnes de la table cible, ou slectionnez Repository partir de la liste Schema puis slectionnez la table cible si le schma a dj t dfini et stock dans la zone Metadata de la vue Repository. Pour ce scnario, choisissez Built-in.

Guide de Rfrence des Composants Talend Open Studio

1039

Scnario : Effectuer des oprations de MERGE directement dans le SGBD

Dfinissez les colonnes comme indiqu ci-dessus, puis cliquez sur OK pour propager la structure du schma au composant de sortie et fermer la bote de dialogue. Renseignez le champ Table Name avec le nom de la table cible, soit customer_info_merge pour ce scnario. Cliquez sur le bouton Guess Query, ou saisissez SELECT * FROM customer_info_merge dans la zone Query afin de rcuprer toutes les colonnes des tables. Dfinissez les proprits du second composant tMysqlInput en utilisant exactement les mmes paramtres que dans le premier composant tMysqlInput. Dans longlet Basic settings de la vue Component de chaque composant tLogRow, slectionnez loption Table dans la zone Mode afin dafficher le rsultat sous forme de tableau dans la console de la vue Run.

Double-cliquez sur le composant tSQLTemplateMerge pour afficher longlet Basic settings de sa vue Component.

Saisissez les noms de la table source et de la table cible dans les champs correspondants.

1040

Guide de Rfrence des Composants Talend Open Studio

Scnario : Effectuer des oprations de MERGE directement dans le SGBD

Pour ce scnario, la table source, new_customer_info, contient huit enregistrements ; la table cible, customer_info_merge, contient cinq enregistrements et les deux tables ont la mme structure. Il est possible que la table source et la table cible aient des schmas diffrents. Dans ce cas, cependant, assurez-vous que la colonne source et la colonne cible spcifies dans chaque ligne des tables Merge ON, UPDATE Columns et INSERT Columns aient un type de donnes identique et que la longueur de la colonne cible permette linsertion de donnes partir de la colonne source correspondante. Dfinissez le schma source manuellement, ou slectionnez Repository partir de la liste Schema et slectionnez la table souhaite si le schma a dj t dfini et stock dans la zone Metadata de la vue Repository. Pour ce scnario, nous utilisons des schmas en mode Built-in.

Dfinissez les colonnes comme indiqu ci-dessus puis cliquez sur OK pour fermer la bote de dialogue. Faites de mme pour le schma cible. Cliquez sur le bouton [+] sous la table Merge ON pour ajouter une ligne et slectionnez la colonne ID comme cl primaire.

Cochez la case Use UPDATE (WHEN MATCHED) pour mettre jour les donnes existantes lors des oprations de MERGE, dfinissez les colonnes mettre jour en cliquant sur le bouton [+] et slectionnez les colonnes souhaites. Le but de ce scnario est de mettre jour toutes les colonnes selon lidentifiant (ID) des utilisateurs. Pour cela, slectionnez toutes les colonnes sauf la colonne ID. Les colonnes dfinies comme cls primaires NE PEUVENT et NE DOIVENT PAS tre mises jour.

Guide de Rfrence des Composants Talend Open Studio

1041

Scnario : Effectuer des oprations de MERGE directement dans le SGBD

Cochez la case Specify UPDATE WHERE clause et saisissez customer_info_merge.ID >= 4 entre guillemets doubles, dans le champ WHERE clause afin que seuls les enregistrements existants ayant un ID gal ou suprieur 4 soient mis jour.

Cochez la case Use INSERT puis dfinissez dans la table INSERT Columns les colonnes o les donnes seront prises et insres. Pour ce scnario, nous souhaitons insrer tous les enregistrements qui nexistent pas dans la table cible.

Slectionnez longlet SQL Template pour afficher et ajouter les modles SQL utiliser. Par dfaut, le composant SQLTemplateMerge utilise deux modles SQL systme : MergeUpdate et MergeInsert. IDans longlet SQL Template, vous pouvez ajouter des modles SQL systme ou crer vos propres modles et les utiliser dans votre Job pour effectuer des oprations codes. Pour plus dinformations, consultez la section intitule Proprits du tSQLTemplateFilterColumns .

1042

Guide de Rfrence des Composants Talend Open Studio

Scnario : Effectuer des oprations de MERGE directement dans le SGBD

Cliquez sur le bouton Add pour ajouter une ligne puis slectionnez Commit dans la liste des modles afin de commiter les rsultats des oprations de MERGE dans votre base de donnes. Autrement, vous pouvez connecter le composant tSQLTemplateMerge un tSQLTemplateCommit ou un tMysqlCommit laide dun lien Trigger > OnSubjobOK afin de commiter les rsultats des oprations dans votre base de donnes. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. La console de la vue Run affiche la fois le contenu dorigine de la table cible ainsi que les rsultats des oprations de MERGE. Dans la table cible, les enregistrements No. 4 et No. 5 contiennent les informations mises jour, tandis que les enregistrements No .6, No. 7 et No. 8 contiennent les informations insres dans la table.

Guide de Rfrence des Composants Talend Open Studio

1043

tSQLTemplateRollback

tSQLTemplateRollback

Proprits du tSQLTemplateRollback
Ce composant est troitement li au composant tSQLTemplateCommit et au composant ELT de connexion correspondant la base de donnes sur laquelle vous travaillez. Ils sont gnralement utiliss ensemble lors de transactions. Famille du composant Fonction Objectif Basic settings ELT/SQLTemplate Le tSQLTemplateRollback annule la transaction dans une base de donnes connecte. Ce composant vite le commit de transaction involontaire. Database Type Component List Slectionnez dans le menu droulant le type de base de donnes sur lequel vous voulez travailler. Slectionnez le composant ELT de connexion le plus pertinent dans la liste si vous prvoyez dajouter plus dune connexion votre Job en cours. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant. Cliquez sur le bouton Add pour ajouter un ou plusieurs modle SQL du systme la liste SQLTemplateList. Cliquez dans la cellule de la colonne SQLTemplate List que vous venez dajouter et slectionnez le modle SQL du systme adquat dans la liste de modles fournis par Talend. Note : Vous pouvez crer vos propres modles SQL et les ajouter la liste SQLTemplate List. Pour crer un nouveau modle SQL : 1- Slectionnez un modle dj existant dans la liste SQLTemplate list et cliquez dans son code dans le champ de code. Une bote de dialogue souvrira vous demandant de crer un nouveau modle. 2- Cliquez sur Yes pour ouvrir la bote de dialogue New SQLTemplate. 3- Renseignez les informations de votre modle SQL et cliquez sur Finish pour fermer la bote de dialogue. Un diteur de modle SQL apparat dans lequel vous pouvez saisir votre code. 4- Cliquez sur le bouton Add pour ajouter le nouveau modle dans la liste SQLTemplate list.

Close Connection Advanced settings SQL Template tStatCatcher Statistics SQLTemplate List

1044

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Pour plus dinformations, consultez le Guide Utilisateur de Talend Open Studio. Utilisation Il faut utiliser ce composant en association avec des composants ELT, notamment avec le tSQLTemplateCommit et le composant ELT de connexion correspondant la base de donnes avec laquelle vous travaillez. n/a

Limitation

Scnario associ
Pour un scnario associ au tSQLTemplateRollback, consultez la section intitule Scnario : Filtrer et agrger les colonnes dune table directement dans le SGBD .

Guide de Rfrence des Composants Talend Open Studio

1045

Guide de Rfrence des Composants Talend Open Studio

Composants ESB
Ce chapitre passe en revue les principaux composants de la famille ESB de la Palette de Talend Open Studio. La famille de composants ESB regroupe les composants ddis aux tches relatives lESB.

Guide de Rfrence des Composants Talend Open Studio

tESBConsumer

tESBConsumer

Proprits du tESBConsumer
Famille de composant Fonction Objectif Basic settings ESB/Web Services Appelle la mthode dfinie du Service Web invoqu et retourne la classe, selon les paramtres spcifis. Invoque une mthode via un Service Web. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Service Configuration Description des bindings et de la configuration du Service Web. Le champ Endpoint est automatiquement rempli aprs compltion de la configuration du service. Configurez une valeur en secondes avant interruption de la connexion au Service Web. Configurez une valeur en secondes pour la rception de la rponse.

Connection time out Receive time out

Input schema et Edit Un schma est une description de lignes, i.e., il dfinit le schema nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour effectuer des changements sur le schma. Notez que le schma devient automatiquement local (Built-in) lorsque vous effectuez des changements. Cliquez sur Sync columns afin de rcuprer automatiquement les colonnes du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement : Guide utilisateur de Talend Open Studio. Response schema Edit schema et Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour effectuer des changements sur le schma. Notez que le schma devient auto-

1048

Guide de Rfrence des Composants Talend Open Studio

Proprits du tESBConsumer

matiquement local (Built-in) lorsque vous effectuez des changements. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Fault Schema et Edit Un schma est une description de lignes, i.e., il dfinit le Schema nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour effectuer des changements sur le schma. Notez que le schma devient automatiquement local (Built-in) lorsque vous effectuez des changements. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. ESB Service Settings Use Service Locator : Maintient la disponibilit du service pour rpondre aux demandes et aux accords de niveau de service (Service Level Agreements). Use Service Activity Monitor : Capture les vnements et stocke les informations pour permettre des analyses en profondeur de lactivit du service et un suivi des messages travers une transaction mtier. Cette option peut tre utilise, entre autres, pour analyser le temps de rponse du service, identifier les modles de trafic ou effectuer une analyse de cause racine. Use Authentication : Cochez cette case pour activer l'option d'authentification. Choisissez entre Basic HTTP, SAML Token (ESB runtime only) et Username Token. Saisissez un identifiant et un mot de passe dans les champs correspondants. L'authentification par l'identifiant fonctionne dans le Studio et l'excution. L'authentification par SAML fonctionne uniquement lors de l'excution. Use http Proxy/Proxy Cochez cette case si vous utilisez un serveur proxy et host, Proxy port, Proxy renseignez les informations ncessaires. user, et Proxy password Trust Server with Cochez cette case pour authentifier le serveur auprs du SSL/TrustStore file et client via un protocole scuris SSL et renseignez les TrustStore password champs suivants : TrustStore file : saisissez le chemin daccs et le nom du fichier TrustStore contenant la liste des certificats approuvs par le client.

Guide de Rfrence des Composants Talend Open Studio

1049

Scnario : Retourner une adresse e-mail valide

TrustStore password : saisissez le mot de passe utilis pour vrifier lintgrit des donnes TrustStore. Mapping link display as Auto : Par dfaut, les liens entre les schmas dentre, de sortie et les paramtres du Service Web sont en forme de courbes. Curves : Les liens entre le schma et les paramtres du Service Web sont en forme de courbes. Lines : Les liens entre le schma et les paramtres du Service Web sont en forme de lignes droites. Cette option optimise lgrement les performances. Die on error Advanced settings Cochez cette case si vous souhaitez arrter le Job en cas derreur.

Service Locator Custom Cette table apparat lorsque la case Use Service Locator Properties est coche. Vous pouvez ajouter autant de lignes que ncessaire afin de personnaliser les proprits correspondantes. Service Activity Custom Cette table apparat lorsque la case Use Service ActiviProperties ty Monitor est coche. Vous pouvez ajouter autant de lignes que ncessaire afin de personnaliser les proprits correspondantes. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation Limitation

Ce composant peut tre utilis comme composant intermdiaire. Il ncessite un composant dentre et un composant de sortie. Une JDK est requise pour que ce composant puisse fonctionner.

Scnario : Retourner une adresse e-mail valide


Ce scnario dcrit un Job utilisant un composant tESBConsumer afin de rcuprer une adresse e-mail valide.

Dposez les composants de la Palette dans lespace de modlisation graphique : tFixedFlowInput, tXMLMap, un tESBConsumer et deux tLogRow.

1050

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner une adresse e-mail valide

Double-cliquez sur le composant tFixedFlowInput afin dafficher sa vue Component et dfinir ses proprits de base (Basic settings).

Cliquez sur le bouton [...] ct du champ Edit Schema.

Cliquez sur le bouton [+] pour ajouter une nouvelle ligne de type String et nommez-la payloadString. Cliquez sur OK. Dans le champ Number of rows, configurez le nombre de lignes 1. Dans la zone Mode, slectionnez Use Single Table et saisissez la requte suivante entre guillemets dans le champ Value : nomatter@gmail.com Connectez le tFixedFlowInput au XMLMap_1. Connectez le tXMLMap au tESBConsumer et nommez le lien payload. Dans lespace de modlisation graphique, double-cliquez sur le tXMLMap afin douvrir le Map Editor. Dans la table de sortie, cliquez-droit sur le nud Email et slectionnez select As loop element dans le menu contextuel. Cliquez sur le nud payloadstring dans la table dentre et dposez-le dans la colonne Expression de la ligne du nud Email dans la table de sortie.

Guide de Rfrence des Composants Talend Open Studio

1051

Scnario : Retourner une adresse e-mail valide

Cliquez sur OK pour valider le mapping et fermer le Map Editor. Dans lespace de modlisation graphique, double-cliquez sur le composant tESBConsumer pour afficher sa vue Basic settings.

1052

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner une adresse e-mail valide

Cliquez sur le bouton [...] ct du champ Service Configuration afin douvrir lditeur.

Dans le champ WSDL, saisissez : http://www.webservicex.net/ValidateEmail.asmx?WSDL Cliquez sur Refresh pour rcuprer le nom du port et de lopration. Dans la liste Port Name, slectionnez le port que vous souhaitez utiliser, ValidateEmailSoap dans cet exemple. Cliquez sur OK.

Guide de Rfrence des Composants Talend Open Studio

1053

Scnario : Retourner une adresse e-mail valide

Dans longlet Basic settings du composant tESBConsumer, configurez le schma dentre Input Schema comme suit :

Configurez le Response Schema comme suit :

Configurez le Fault Schema comme suit :

Reliez le tESBConsumer aux deux tLogRow. Dans le Job, double-cliquez sur le composant tLogRow_1 afin dafficher sa vue Component et dfinir ses Basic settings.

1054

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner une adresse e-mail valide

Cliquez sur le bouton [...] ct du champ Edit Schema et configurez le schma comme suit :

Dans lespace de modlisation graphique, double-cliquez sur le composant tLogRow_2 afin dafficher sa vue Component et dfinir ses Basic settings

Cliquez sur le bouton [...] ct du champ Edit Schema et configurez le schma comme suit :

Guide de Rfrence des Composants Talend Open Studio

1055

Scnario : Retourner une adresse e-mail valide

Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Dans le log dexcution, vous pouvez voir : Starting job consumer4 at 15:02 21/04/2011. [statistics] connecting to socket on port 4057 [statistics] connected ValidateEmail ValidateEmailSoap | {http://www.webservicex.net}ValidateEmail {http://www.webservicex.net}ValidateEmailSoap IsValidEmail [tLogRow_2] payload: <?xml version="1.0" encoding="UTF-8"?> <IsValidEmailResponse xmlns="http:// www.webservicex.net"><IsValidEmailResult>false</IsValidEmailResult></ IsValidEmailResponse> [statistics] disconnected Job consumer4 ended at 15:03 21/04/2011. [exit code=0]

1056

Guide de Rfrence des Composants Talend Open Studio

tESBProviderFault

tESBProviderFault

Ce composant est adapt pour une utilisation au sein de la version ESB du Studio. Il requiert l'utilisation du noeud de Repository Service et des assistants de cration de Services.

Proprits du tESBProviderFault
Famille de composant Fonction Objectif Basic settings ESB/Web Services Gnre un message Fault (message derreur) provenant du Service Web, la fin du Job Talend. Retourne un message Fault provenant du Service Web la fin du cycle du Job Talend. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour effectuer des changements sur le schma. Notez que le schma devient automatiquement local (Built-in) lorsque vous effectuez des changements. Cliquez sur Sync columns afin de rcuprer automatiquement les colonnes du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. EBS service settings - Valeur de faultString dans le message Fault. fault title Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

Ce composant doit tre utilis uniquement avec le composant tESBProviderRequest. Une JDK est requise pour que ce composant puisse fonctionner.

Scnario : Retourner un message Fault


Les Jobs suivants, construits sur les composants de la famille ESB/Web Service implmentent des services Web dfinis dans le nud Services du Repository. Ils requirent la cration et l'association des services correspondants. Pour plus d'informations concernant les services, consultez le Guide utilisateur de Talend ESB Studio (en anglais).

Guide de Rfrence des Composants Talend Open Studio

1057

Scnario : Retourner un message Fault

Dans ce scnario, un Job fournisseur et un Job consommateur sont ncessaires. Par ailleurs, le service correspondant doit dj exister sous le nud Services, avec l'URI http://127.0.0.1.8088/esb/provider/?WSDL, le port LOCAL_providerSoapBinding et l'opration invoke(anyType):anyType. Le Job fournisseur comprend un tESBProviderRequest, un tESBProviderFault, un tXMLMap et deux tLogRow.

Dposez les composants suivants de la Palette dans lespace de modlisation graphique : un tESBProviderRequest, un tESBProviderFault, un tXMLMap et deux tLogRow. Double-cliquez sur le composant tESBProvider Request afin dafficher sa vue Basic settings.

Dans la liste Property Type, slectionnez Repository et cliquez sur le bouton [...] afin de slectionner le service, la granularit du nom du port et l'opration.

1058

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner un message Fault

Cliquez sur OK. Cliquez sur le bouton [...] ct du champ Edit schema afin de voir le schma du composant tESBProvider Request.

Reliez le composant tESBProviderRequest au tLogRow_1 Double-cliquez sur le composant tLogRow_1 pour afficher sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema afin de configurer le schma comme suit.

Reliez le tLogRow_1 au tXMLMap. Connectez le tXMLMap au tLogRow_2 et nommez le lien payload. Double-cliquez sur le tXMLMap afin douvrir le Map Editor. Dans la table de gauche, cliquez-droit sur root afin douvrir le menu contextuel. Dans le menu contextuel, slectionnez Create Sub-Element et saisissez request dans la bote de dialogue qui souvre. Rptez lopration pour crer un sous-lment response au nud root de la table de sortie.

Guide de Rfrence des Composants Talend Open Studio

1059

Scnario : Retourner un message Fault

Cliquez-droit sur le nud request de la table dentre et slectionnez As loop element dans le menu contextuel. Cliquez sur le nud request dans la table dentre et dposez-le dans la colonne Expression dans la ligne du nud response de la table de sortie. Cliquez sur OK afin de valider le mapping et fermer le Map Editor.

Dans lespace de modlisation graphique, double-cliquez sur le tLogRow_2 pour afficher sa vue Component et dfinir ses proprits de base.

1060

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner un message Fault

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Connectez le composant tLogRow_2 au tESBProviderFault. Dans lespace de modlisation graphique, double-cliquez sur le composant tESBProviderFault afin dafficher sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Le Job peut tre excut sans erreur. Le Job consommateur comprend un tFixedFlowInput, un tXMLMap, un tESBConsumer et deux composants tLogRow.

Guide de Rfrence des Composants Talend Open Studio

1061

Scnario : Retourner un message Fault

De la Palette vers lespace de modlisation graphique, dposez les composants tFixedFlowInput, tXMLMap, tESBConsumer et deux tLogRow. Double-cliquez sur le composant tFixedFlowInput afin dafficher sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema.

1062

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner un message Fault

Cliquez sur le bouton [+] pour ajouter une ligne de type String et nommez-la payloadString. Cliquez sur OK. Dans la zone Mode, slectionnez Use Single Table et saisissez Test error, entre guillemets, dans le champ Value. Reliez le tFixedFlowInput au tXMLMap. Reliez le tXMLMap au tESBConsumer et nommez la connexion payload. Dans lespace de modlisation graphique, double-cliquez sur le tXMLMap afin douvrir le Map Editor. Dans la partie infrieure droite de lditeur, cliquez sur le bouton [+] pour ajouter une ligne la table payload et nommez-la ligne payload. Dans la colonne Type de la ligne payload, slectionnez Document comme type de donnes. Le nud XML correspondant est ajout automatiquement la table de droite, reprsentant la sortie. Dans la table payload, cliquez-droit sur root afin douvrir son menu contextuel. Dans le menu contextuel, slectionnez Create Sub-Element et saisissez request dans la bote de dialogue qui souvre. Cliquez-droit sur le nud request et slectionnez As loop element dans le menu contextuel. Cliquez sur le nud payloadstring de la table dentre et dposez-le dans la colonne Expression de la ligne du nud request dans la table de sortie. Cliquez sur OK pour valider le mapping et fermer le Map Editor.

Guide de Rfrence des Composants Talend Open Studio

1063

Scnario : Retourner un message Fault

Excutez le Job fournisseur. Dans le log dexcution, vous pouvez voir ... web service [endpoint: http://127.0.0.1.8088/esbprovider?WSDL] published ... Dans la vue Component du composant tESBConsumer du Job consommateur, cliquez-droit sur le bouton [...] ct du champ Service Configuration afin douvrir lditeur.

1064

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner un message Fault

Dans le champ WSDL, saisissez : http://127.0.0.1.8088/esb/provider?WSDL. Cliquez sur Refresh afin de rcuprer le nom du port et de lopration.

Cliquez sur OK. Dans la vue Basic settings du composant tESBConsumer, configurez le schma dentre Input schema comme suit.

Guide de Rfrence des Composants Talend Open Studio

1065

Scnario : Retourner un message Fault

Configurez le schma Response schema comme suit.

Configurez le schma Fault schema comme suit.

Connectez le tESBConsumer_1 aux deux tLogRow. Arrtez le Job fournisseur. Dans le Job consommateur, double-cliquez sur le tLogRow_1 afin dafficher sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

1066

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner un message Fault

Dans lespace de modlisation graphique, double-cliquez sur le composant tLogRow_2 pour afficher sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Le Job peut tre excut sans erreur. Excutez le Job fournisseur. Dans le log dexcution, vous pouvez voir : ... 2011-04-19 15:38:33.486:INFO::jetty-7.2.2.v20101205 2011-04-19 15:38:33.721:INFO::Started SelectChannelConnector@127.0.0.1:8088 web service [endpoint: http://127.0.0.1:8088/esb/provider] published Excutez le Job consommateur. Dans le log dexcution, vous pouvez voir : Starting job consumer at 15:39 19/04/2011. [statistics] connecting to socket on port 3850 [statistics] connected LOCAL_provider

Guide de Rfrence des Composants Talend Open Studio

1067

Scnario : Retourner un message Fault

LOCAL_providerSoapBinding | {http://talend.org/esb/service/job}LOCAL_provider {http://talend.org/esb/service/job}LOCAL_providerSoapBinding invoke [tLogRow_1] faultString: TestFaultTitle [tESBProviderFault_1] faultDetail: <?xml version="1.0" encoding="UTF-8"?> <response xmlns="http://talend.org/esb/service/job">Fault message text: Test error!</response> [statistics] disconnected Job consumer ended at 15:39 19/04/2011. [exit code=0] Dans le log fournisseur, vous pouvez voir la trace de lexception : ... WARNING: Application {http://talend.org/esb/service/ job}LOCAL_provider#{http://talend.org/esb/service/job}invoke has thrown exception, unwinding now org.apache.cxf.binding.soap.SoapFault: TestFaultTitle [tESBProviderFault_1] ... Lexception tait attendue, puisquun message Fault est gnr.

1068

Guide de Rfrence des Composants Talend Open Studio

tESBProviderRequest

tESBProviderRequest

Ce composant est adapt pour une utilisation au sein de la version ESB du Studio. Il requiert l'utilisation du noeud de Repository Service et des assistants de cration de Services.

Proprits du tESBProviderRequest
Famille de composant Fonction Objectif Basic settings ESB/Web Services Expose un Job Talend comme un Service Web. Attend un message de requte dun consommateur et le passe au composant suivant. Property Type Peut tre Built-in ou Repository. Built-in : Aucun fichier WSDL n'est configur pour le Job. Vous devez associer le Job un Service Web dfini dans le nud Services du Repository. Voir galement le Guide utilisateur de Talend Open Studio Repository : Slectionnez le Service Web dans la liste Repository, la granularit du port et l'opration. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour effectuer des changements sur le schma. Notez que le schma devient automatiquement local (Built-in) lorsque vous effectuez des changements. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Keep listening Cochez cette case lorsque vous souhaitez assurer que le fournisseur (le Job Talend) continue couter les requtes aprs traitement de la premire requte entrante. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant couvre la possibilit dexposer un Job Talend en tant que Service, avec la possibilit dcrire une requte de service dans un Job et retourne le rsultat du Job en tant que rponse. Le composant tESBProviderRequest doit tre utilis avec le tESBProviderResponse afin de fournir une rponse la fin du Job, dans le cas dune communication de style requte-rponse.

Limitation

Une JDK est requise pour que ce composant fonctionne.

Guide de Rfrence des Composants Talend Open Studio

1069

Scnario : Envoi dun message via un service sans attente de rponse

Scnario : Envoi dun message via un service sans attente de rponse


Les Jobs suivants, construits sur les composants de la famille ESB/Web Service implmentent des services Web dfinis dans le nud Services du Repository. Ils requirent la cration et l'association des services correspondants. Pour plus d'informations concernant les services, consultez le Guide utilisateur de Talend ESB Studio (en anglais). Dans ce scnario, un Job fournisseur et un Job consommateur sont ncessaires. Par ailleurs, le service correspondant doit dj exister sous le nud Services, avec l'URI http://127.0.0.1.8088/esb/provider/?WSDL, le port TEST_ProviderJobSoapBinding et l'opration invoke(anyType):anyType Le Job fournisseur comprend les composants suivants : tESBProvider, tXMLMap et deux tLogRow.

Dposez les composants suivants de la Palette dans lespace de modlisation graphique : un tESBProviderRequest, un tXMLMap et deux tLogRow. Double-cliquez sur le composant tESBProvider Request afin douvrir sa vue Basic settings.

Slectionnez Repository dans la liste Property Type et cliquez sur le bouton [...] afin de choisir le service, la granularit du port et l'opration.

1070

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoi dun message via un service sans attente de rponse

Cliquez sur OK. Cliquez sur le bouton [...] ct du champ Edit schema pour voir le schma du composant tESBProvider Request.

Cliquez sur OK. Connectez le tESBProviderRequest au composant tLogRow_1. Double-cliquez sur le tLogRow_1 dans lespace de modlisation graphique afin dafficher sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Connectez le tLogRow_1 au tXMLMap. Reliez le tXMLMap et tLogRow_2 et nommez la connexion payload. Dans lespace de modlisation graphique, double-cliquez sur le tXMLMap afin douvrir le Map Editor. Dans la partie infrieure droite de lditeur, cliquez sur le bouton [+] pour ajouter une ligne la table payload et nommez cette ligne payload. Dans la colonne Type de cette ligne payload, slectionnez le type de donnes Document. La racine XML correspondante est ajoute automatiquement la table suprieure de droite, reprsentant le flux de sortie.

Guide de Rfrence des Composants Talend Open Studio

1071

Scnario : Envoi dun message via un service sans attente de rponse

Dans la table payload, cliquez-droit sur root pour ouvrir son menu contextuel. Dans le menu contextuel, slectionnez Create Sub-Element et saisissez response dans la bote de dialogue. Cliquez-droit sur le nud response et slectionnez As loop element dans le menu contextuel. Rptez lopration pour crer un sous-lment request du noeud root dans la table dentre et dfinissez le nud request comme lment de boucle. Cliquez sur le nud request dans la table dentre et dposez-le dans la colonne Expression de la ligne du nud response de la table de sortie.

Cliquez sur OK pour valider le mapping et fermer lditeur. Double-cliquez sur le tLogRow_2 dans lespace de modlisation graphique afin dafficher sa vue Basic settings.

1072

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoi dun message via un service sans attente de rponse

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Sauvegardez le Job. Le Job consommateur comprend un tFixedFlowInput, un tXMLMap, un tESBConsumer et deux tLogRow.

Dposez les composants suivants de la Palette dans lespace de modlisation graphique : un tFixedFlowInput, un tXMLMap, un tESBConsumer et deux tLogRow. Double-cliquez sur le tFixedFlowInput afin dafficher sa vue Basic settings.

Guide de Rfrence des Composants Talend Open Studio

1073

Scnario : Envoi dun message via un service sans attente de rponse

Configurez le schma du composant tFixedFlowInput.

Cliquez sur le bouton [+] pour ajouter une ligne de type String et nommez-la payloadString. Cliquez sur OK. Dans le champ Number of rows, configurez le nombre de lignes 1. Dans la zone Mode, slectionnez Use Single Table et saisissez world entre guillemets, dans le champ Value. Connectez le tFixedFlowInput au tXMLMap. Reliez le tXMLMap au tESBConsumer et nommez la connexion payload.

1074

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoi dun message via un service sans attente de rponse

Dans lespace de modlisation graphique, double-cliquez sur le tXMLMap pour ouvrir le Map Editor. Dans la table de sortie, cliquez-droit sur root pour ouvrir son menu contextuel. Dans le menu contextuel, slectionnez Create Sub-Element et saisissez request dans la bote de dialogue. Cliquez-droit sur le nud request et slectionnez As loop element dans le menu contextuel. Cliquez sur le nud payloadstring dans la table dentre et dposez-le dans la colonne Expression dans la ligne du nud request de la table de sortie.

Cliquez sur OK pour valider le mapping et fermer lditeur. Dmarrez le Job fournisseur. Dans le log dexcution, vous pouvez voir : ... web service [endpoint: http://127.0.0.1:8088/esb/provider] published ... Dans la vue Component du tESBConsumer, configurez ses proprits.

Guide de Rfrence des Composants Talend Open Studio

1075

Scnario : Envoi dun message via un service sans attente de rponse

Cliquez sur le bouton [...] ct du champ Service Configuration afin douvrir lditeur.

Dans le champ WSDL, saisissez : http://127.0.0.1:8088/esb/provider?WSDL Cliquez sur le bouton Refresh afin de rcuprer le nom du port et de lopration.. Cliquez sur OK. Configurez le schma dentre (Input Schema) du composant tESBConsumer comme suit.

1076

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoi dun message via un service sans attente de rponse

Configurez le schma de rponse (Response Schema) comme suit.

Configurez le schma Fault comme suit.

Connectez le composant tESBConsumer au tLogRow_1 et au tLogRow_2. Dans lespace de modlisation graphique, double-cliquez sur le tLogRow_1 afin dafficher sa vue Basic settings.

Guide de Rfrence des Composants Talend Open Studio

1077

Scnario : Envoi dun message via un service sans attente de rponse

Cliquez sur le bouton ct du champ Edit schema et configurez le schma comme suit.

Dans lespace de modlisation graphique, double-cliquez sur tLogRow_2 afin dafficher sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

1078

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoi dun message via un service sans attente de rponse

Sauvegardez le Job. Excutez le Job fournisseur. Vous pouvez voir dans le log dexcution : INFO: Setting the server's publish address to be http://127.0.0.1:8088/esb/provider 2011-04-21 14:14:36.793:INFO::jetty-7.2.2.v20101205 2011-04-21 14:14:37.856:INFO::Started SelectChannelConnector@127.0.0.1:8088 web service [endpoint: http://127.0.0.1:8088/esb/provider] published Excutez le Job consommateur. Vous pouvez voir dans le log dexcution du Job : Starting job CallProvider at 14:15 21/04/2011. [statistics] connecting to socket on port 3942 [statistics] connected TEST_ESBProvider2 TEST_ESBProvider2SoapBingding | [tLogRow_2] payloadString: <request>world</request> {http://talend.org/esb/service/job}TEST_ESBProvider2 {http://talend.org/esb/service/job}TEST_ESBProvider2SoapBinding invoke [tLogRow_1] payload: null [statistics] disconnected Job CallProvider2 ended at 14:16 21/04/2011. [exit code=0] Dans le log du fournisseur vous pouvez voir le log des traces : web service [endpoint: http://127.0.0.1:8088/esb/provider] published [tLogRow_1] payload: <?xml version="1.0" encoding="UTF-8"?> <request>world</request> ### world [tLogRow_2] content: world [tLogRow_3] payload: <?xml version="1.0" encoding="UTF-8"?> <response xmlns="http://talend.org/esb/service/job">Hello, world!</ response> web service [endpoint: http://127.0.0.1:8088/esb/provider] unpublished [statistics] disconnected Job ESBProvider2 ended at 14:16 21/04/2011. [exit code=0]

Guide de Rfrence des Composants Talend Open Studio

1079

tESBProviderResponse

tESBProviderResponse
Ce composant est adapt pour une utilisation au sein de la version ESB du Studio. Il requiert l'utilisation du noeud de Repository Service et des assistants de cration de Services.

Proprits du tESBProviderResponse
Famille de composant Fonction Objectif Basic settings ESB/Web Services Le composant tESBProviderResponse gnre un message de rponse la fin dun Job Talend. Retourne une rponse comme fournisseur de service la fin de chaque cycle dun Job Talend. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour effectuer des changements sur le schma. Notez que le schma devient automatiquement local (Built-in) lorsque vous effectuez des changements. Cliquez sur Sync columns afin de rcuprer automatiquement les colonnes du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

Le composant tESBProviderRequest. doit tre utilis avec le tESBProviderRequest afin de fournir une rponse la fin dun Job, pour un fournisseur de service, dans le cas dune communication de style requte-rponse. Une JDK est requise pour que ce composant fonctionne.

Limitation

Scnario : Retourner une rponse Hello world


Les Jobs suivants, construits sur les composants de la famille ESB/Web Service implmentent des services Web dfinis dans le nud Services du Repository. Ils requirent la cration et l'association des services correspondants. Pour plus d'informations concernant les services, consultez le Guide utilisateur de Talend ESB Studio (en anglais). Dans ce scnario, un Job fournisseur et un Job consommateur sont ncessaires. Par ailleurs, le service correspondant doit dj exister sous le nud Services, avec l'URI http://127.0.0.1.8088/esb/provider/?WSDL, le port TEST_ProviderJobSoapBinding et l'opration invoke(anyType):anyType

1080

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner une rponse Hello world

Le Job fournisseur comprend les composants suivants : un tESBProviderRequest, un tXMLMap et deux tLogRow.

Dposez les composants suivants de la Palette dans lespace de modlisation graphique : un tESBProviderRequest, un XMLMap et deux tLogRow. Dans lespace de modlisation graphique, double-cliquez sur le composant tESBProviderRequest afin dafficher sa vue Basic settings.

Dans la liste Property Type, slectionnez Repository et cliquez sur le bouton [...] afin de slectionner le service, la granularit du port et l'opration.

Cliquez sur OK. Cliquez sur le bouton [...] ct du champ Edit schema afin de voir le schma.

Guide de Rfrence des Composants Talend Open Studio

1081

Scnario : Retourner une rponse Hello world

Cliquez sur OK. Connectez le tESBProviderRequest au tLogRow_1. Double-cliquez sur le tLogRow_1 afin dafficher sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Reliez le tLogRow_1 au tXMLMap. Reliez le tXMLMap au tLogRow_2 et nommez la connexion payload. Dans lespace de modlisation graphique, double-cliquez sur le tXMLMap afin douvrir le Map Editor. Dans la partie infrieure droite de lditeur, cliquez sur le bouton [+] pour ajouter une ligne la table payload. Nommez cette ligne payload. Dans la colonne Type de la ligne payload, slectionnez le type de donnes Document. La racine XML correspondante est ajoute automatiquement la table suprieure de droite, reprsentant le flux de sortie. Dans la table payload, cliquez-droit sur root pour ouvrir le mme menu contextuel.

1082

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner une rponse Hello world

Dans le menu contextuel, slectionnez Create Sub-Element et saisissez response dans la bote de dialogue. Cliquez-droit sur le nud response et slectionnez As loop element dans le menu contextuel. Rptez lopration pour crer un sous-lment request du nud root dans la table dentre et dfinissez le nud request comme lment de boucle. Cliquez sur le nud request dans la table dentre et dposez-le dans la colonne Expression dans la ligne du nud response de la table de sortie.

Cliquez sur OK pour valider le mapping et fermer lditeur Dans lespace de modlisation graphique, double-cliquez sur le tLogRow_2 afin dafficher sa vue Basic settings.

Guide de Rfrence des Composants Talend Open Studio

1083

Scnario : Retourner une rponse Hello world

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Sauvegardez le Job fournisseur. Le Job consommateur comprend un tFixedFlowInput, un tXMLMap, un tESBConsumer et deux tLogRow.

Dposez les composants suivants de la Palette dans lespace de modlisation graphique : un tFixedFlowInput, un tXMLMap, un tESBConsumer et deux tLogRow. Double-cliquez sur le composant tFixedFlowInput afin dafficher sa vue Basic settings.

1084

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner une rponse Hello world

Cliquez sur le bouton [...] ct du champ Edit schema afin d'diter le schma.

Cliquez sur le bouton [+] pour ajouter une nouvelle ligne de type String et nommez-la payloadString. Cliquez sur OK. Dans le champ Number of rows, dfinissez le nombre de lignes 1. Dans la zone Mode, slectionnez Use Single Table et saisissez world entre guillemets, dans le champ Value. Reliez le tFixedFlowInput au tXMLMap. Connectez le tXMLMap au tESBConsumer et nommez la connexion payload. Dans lespace de modlisation graphique, double-cliquez sur le tXMLMap pour ouvrir le Map Editor. Dans la table de sortie, cliquez-droit sur root pour ouvrir son menu contextuel. Dans le menu contextuel, slectionnez Create Sub-Element et saisissez request dans la bote de dialogue. Cliquez-droit sur le nud request et slectionnez As loop element dans le menu contextuel. Cliquez sur le nud payloadstring de la table dentre et dposez-le dans la colonne Expression de la ligne du nud request dans la table de sortie.

Guide de Rfrence des Composants Talend Open Studio

1085

Scnario : Retourner une rponse Hello world

Cliquez sur OK pour valider le mapping et fermer le Map Editor. Dmarrez le Job fournisseur. Vous pouvez voir, dans le log dexcution : ... web service [endpoint: http://127.0.0.1:8088/esb/.provider] published ... Dans la vue Component du tESBConsumer, configurez les proprits du composant.

1086

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner une rponse Hello world

Cliquez sur le bouton [...] ct du champ Service Configuration pour ouvrir lditeur.

Dans le champ WSDL, saisissez : http://127.0.0.1:8088/esb/provider?WSDL Cliquez sur le bouton Refresh afin de rcuprer le nom du port et de lopration. Cliquez sur OK. Dans la vue Basic settings du composant tESBConsumer, configurez le schma dentre (Input Schema) comme suit.

Configurez le schma de rponse (Response Schema) comme suit.

Guide de Rfrence des Composants Talend Open Studio

1087

Scnario : Retourner une rponse Hello world

Configurez le schma (Fault Schema) comme suit.

Connectez le tESBConsumer aux deux composants tLogRow. Dans lespace de modlisation graphique, double-cliquez sur le composant tLogRow_1 afin douvrir sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Dans lespace de modlisation graphique, double-cliquez sur le tLogRow_2 afin dafficher sa vue Basic settings.

1088

Guide de Rfrence des Composants Talend Open Studio

Scnario : Retourner une rponse Hello world

Cliquez sur le bouton [...] ct du champ Edit schema et configurez le schma comme suit.

Sauvegardez le Job consommateur. Excutez le Job fournisseur. Vous pouvez voir, dans le log dexcution : 2011-04-21 15:28:26.874:INFO::jetty-7.2.2.v20101205 2011-04-21 15:28:27.108:INFO::Started SelectChannelConnector@127.0.0.1:8088 web service [endpoint: http://127.0.0.1:8088/esb/provider] published Excutez le Job consommateur. Vous pouvez voir, dans le log dexcution du Job : Starting job CallProvider at 14:15 21/04/2011. [statistics] connecting to socket on port 3942 [statistics] connected TEST_ESBProvider2 TEST_ESBProvider2SoapBingding | [tLogRow_2] payloadString: <request>world</request> {http://talend.org/esb/service/job}TEST_ESBProvider2 {http://talend.org/esb/service/job}TEST_ESBProvider2SoapBinding invoke [tLogRow_1] payload: null [statistics] disconnected Job CallProvider2 ended at 14:16 21/04/2011. [exit code=0] Dans le log fournisseur, vous pouvez voir les traces :

Guide de Rfrence des Composants Talend Open Studio

1089

Scnario : Retourner une rponse Hello world

web service [endpoint: http://127.0.0.1:8088/esb/provider] published [tLogRow_1] payload: <?xml version="1.0" encoding="UTF-8"?> <request>world</request> ### world [tLogRow_2] content: world [tLogRow_3] payload: <?xml version="1.0" encoding="UTF-8"?> <response xmlns="http://talend.org/esb/service/job">Hello, world!</ response> web service [endpoint: http://127.0.0.1:8088/esb/provider] unpublished [statistics] disconnected Job ProviderJob ended at 15:29 21/04/2011. [exit code=0]

1090

Guide de Rfrence des Composants Talend Open Studio

tRESTRequest

tRESTRequest

Proprits du tRESTRequest
Famille de composant Fonction Objectif Basic settings ESB/REST Le composant tRestRequest envoie une requte HTTP du client au serveur afin d'crire, de lire et/ou de supprimer des donnes. Ce composant vous permet d'utiliser les oprations GET/POST/PUT/DELETE afin d'envoyer des requtes HTTP au serveur. REST Endpoint Renseignez ce champ en saisissant l'emplacement de l'URI o le service Web RESTful sera accessible pour les requtes. Cliquez sur le bouton [+] sous la table de mapping pour ajouter des lignes pour spcifier des requtes HTTP : Output Flow : Cliquez sur le bouton [...] afin de spcifier le nom d'un flux de sortie et configurez le schma du flux de sortie dans la bote de dialogue qui suit. HTTP Verb : Slectionnez une mthode HTTP (GET/ POST/PUT/DELETE) dans la liste. URI pattern : Renseignez ce champ avec les URIs RESTful dcrivant la ressource. Keep listening Cochez cette case lorsque vous souhaitez vous assurer que le fournisseur (et donc le Job Talend) continue couter les requtes aprs traitement de la premire requte entrante. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

REST API Mapping

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant permet d'exposer un Job Talend en tant que service et de transmettre une requte un service dans un Job puis retourne les rsultats du Job en tant que rponse du service. Le composant tRESTRequest doit tre utilis avec le tRESTResponse afin de fournir les rsultats d'un Job en tant que rponse, dans le cas d'une communication de style requte-rponse.

Limitation

n/a

Scnario : Envoi d'un message avec une rponse dans un service REST
Ce scnario dcrit le processus d'envoi d'un message un serveur Web et la rception du serveur.

Guide de Rfrence des Composants Talend Open Studio

1091

Scnario : Envoi d'un message avec une rponse dans un service REST

Configurer le composant tRESTRequest


1. Dposez les composants suivants de la Palette dans l'espace de modlisation graphique : tRESTRequest, tXMLMap et tRESTResponse. 2. Double-cliquez sur le composant tRESTRequest dans l'espace de modlisation graphique afin d'afficher sa vue Basic settings.

3. Dans le champ REST Endpoint, saisissez l'URI suivante : "http://localhost:8088/user/" 4. Cliquez sur le bouton [+] pour ajouter une ligne dans la table REST API Mapping. 5. Slectionnez la nouvelle ligne et cliquez sur le bouton [...] de la colonne Output Flow afin d'ajouter un schma pour le flux de sortie. Dans ce scnario, nommez le flux de sortie GetOneUser.

6. Cliquez sur le bouton [+] afin d'ajouter une ligne id au schma. Cliquez sur OK pour sauvegarder le schma. 7. Slectionnez GET dans la colonne HTTP Verb. 8. Dans la colonne URI Pattern, saisissez "/{id}/".

1092

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoi d'un message avec une rponse dans un service REST

9. Cochez la case Keep Listening.

Configurer le tXMLMap
1. Reliez le composant tRESTRequest_1 au tXMLMap l'aide d'un lien Row > GetOneUser. 2. Double-cliquez sur le tXMLMap dans l'espace de modlisation graphique pour afficher sa vue Basic settings et cliquez sur le bouton [...] pour ouvrir le Map Editor.

3. Cliquez sur le bouton [+] en haut droite afin d'ajouter une table de sortie et nommez-la ResponseUsers. 4. Cliquez sur le bouton [+] en bas droite pour ajouter deux colonnes en sortie. Nommez la premire colonne xml et, dans la colonne Type, slectionnez Document. Nommez la seconde colonne string et, dans la colonne Type, slectionnez String.

Guide de Rfrence des Composants Talend Open Studio

1093

Scnario : Envoi d'un message avec une rponse dans un service REST

5. Cliquez-droit sur le nud root et slectionnez Create Sub-Element pour crer un sous-lment. Nommez le sous-lment foo dans la bote de dialogue qui s'ouvre.

6. Cliquez-droit sur le nud foo et slectionnez As loop element. Dans le champ gauche du nud, saisissez "foo". 7. Cliquez sur OK afin de sauvegardez les paramtres.

Configurer le composant tRESTResponse


1. Reliez le tXMLMap au tRESTResponse l'aide d'un lien Row > ResponseUsers puis double-cliquez sur ce composant.

2. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent.

1094

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoi d'un message avec une rponse dans un service REST

3. Slectionnez OK(200) dans la liste Return status code. 4. Laissez les autres champs tels qu'ils sont.

Sauvegarder et excuter le Job


Sauvegardez le Job et appuyez sur F6 pour l'excuter.

La requte HTTP demandant l'ID d'un utilisateur est envoye au serveur et s'affiche dans la console, avec sa rponse HTTP.

Guide de Rfrence des Composants Talend Open Studio

1095

tRESTResponse

tRESTResponse

Proprits du tRESTResponse
Famille de composant Fonction Objectif Basic settings ESB/REST Le composant tRestResponse envoie une rponse HTTP au client la rception d'une requte HTTP. Ce composant vous permet de retourner un code de statut HTTP spcifique au client comme rponse une requte HTTP. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour effectuer des changements sur le schma. Notez que le schma devient automatiquement local (Built-in) lorsque vous effectuez des changements. Cliquez sur Sync columns afin de rcuprer automatiquement les colonnes du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Return status code Advanced settings Utilisation tStatCatcher Statistics Slectionnez un code de statut dans la liste pour indiquer le statut de la requte. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

Ce composant permet d'exposer un Job Talend en tant que service et de transmettre une requte un service dans un Job puis retourne les rsultats du Job en tant que rponse du service. Le composant tRESTResponse doit tre utilis avec le tRESTRequest afin de fournir les rsultats d'un Job en tant que rponse, dans le cas d'une communication de style requte-rponse.

Limitation

n/a

Scnario associ
Pour un scnario dans lequel le tRESTResponse est utilis, consultez la section intitule Scnario : Envoi d'un message avec une rponse dans un service REST .

1096

Guide de Rfrence des Composants Talend Open Studio

Composants File
Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille File de la Palette de Talend Open Studio. La famille File regroupe les composants qui lisent et crivent des donnes dans tous types de fichiers un seul ou plusieurs schmas, du plus courant au format le plus spcifique (dans les sous-familles Input et Output). De plus, la sous-famille Management regroupe des composants ddis aux fichiers qui peuvent effectuer diverses traitements sur les fichiers, notamment la dcompression, la suppression, la copie, la comparaison de fichiers, etc.

Guide de Rfrence des Composants Talend Open Studio

tAdvancedFileOutputXML

tAdvancedFileOutputXML

tAdvancedFileOutputXML appartient deux familles de composants : File et XML. Pour plus dinformations concernant le composant tAdvancedFileOutputXML, consultez la section intitule tAdvancedFileOutputXML .

1098

Guide de Rfrence des Composants Talend Open Studio

tApacheLogInput

tApacheLogInput

Proprits du tApacheLogInput
Component family Fonction Objectif File/Input Le composant tApacheLogInput permet de lire le fichier de log daccs dun serveur Apache. Le tApacheLogInput aide la gestion effective du serveur Apache. Il est obligatoire lorsquil sagit dobtenir un retour sur lactivit et les performances du serveur, mais aussi sur les problmes susceptibles de se produire. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. File Name Chemin daccs et nom du fichier, et/ou variable traiter. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Basic settings

Advanced settings

Encoding

tStatCatcher Statistics Utilisation

Ce composant peut tre utilis en standalone. Il permet de crer un flux de donnes laide dun lien Row > Main, ainsi que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet du composant tFileInputXML. n/a

Limitation

Guide de Rfrence des Composants Talend Open Studio

1099

Scnario : Lire un fichier de log daccs Apache

Scnario : Lire un fichier de log daccs Apache


Le scnario suivant cre un Job deux composants permettant de lire le fichier de log daccs dun serveur Apache et dafficher les donnes en sortie dans la console de log Run. A partir de la Palette, cliquez-dposez les composants tApacheLogInput et tLogRow dans lditeur graphique. Cliquez droit sur le tApacheLogInput et slectionnez une connexion Row > Main dans le menu contextuel. Cliquez ensuite sur le tLogRow, le lien appropri apparat entre les deux composants.

Dans lditeur graphique, slectionnez le tApacheLogInput. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du composant tApacheLogInput.

Configurer les champs Property Type et Schema en mode Built-In. Cliquez sur le bouton Edit schema si vous souhaitez voir les colonnes (en mode read-only). Dans le champ File Name, renseignez le chemin daccs ou parcourez vos dossiers jusquau fichier de log daccs que vous voulez lire. Dans lditeur graphique, slectionnez le composant tLogRow et cliquez sur la vue Component pour un dfinir la configuration de base (Basic settings). Pour plus dinformations, consultez la section intitule tLogRow . Appuyez sur F6 pour excuter le Job.

1100

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lire un fichier de log daccs Apache

Les lignes de log du fichier dfini sont affiches dans la console.

Guide de Rfrence des Composants Talend Open Studio

1101

tChangeFileEncoding

tChangeFileEncoding

tChangeFileEncoding Properties
Component family Function Purpose File/Management Le composant tChangeFileEncoding permet de modifier lencodage dun fichier donn. Le tChangeFileEncoding transforme lencodage des caractres dun fichier donn, et gnre un nouveau fichier en fonction de lencodage des caractres transforms. Use Custom Input En- Cochez cette case pour personnaliser le type coding dencodage des caractres. Lorsque cette case est coche, une liste des types dencodage dentre apparat, vous permettant soit de slectionner un type dencodage dentre parmi les encodages proposs, soit de spcifier vous-mme un type dencodage dentre en slectionnant CUSTOM. Encoding A partir de cette liste de types dencodage, vous pouvez slectionnez lune des options proposes, ou personnaliser lencodage des caractres en slectionnant CUSTOM, et spcifier un type dencodage de caractres.. Chemin daccs au fichier dentre. Chemin daccs au fichier de sortie.

Basic settings

Input File Name Output File Name Utilisation Limitation n/a

Ce composant doit tre utilis en standalone.

Scnario: Transformer lencodage des caractres dun fichier


Ce scnario Java dcrit un Job trs simple permettant de transformer lencodage des caractres dun fichier texte, et de gnrer un nouveau fichier en tenant compte du nouvel encodage des caractres. A partir de la Palette, cliquez et dposez un composant tChangeFileEncoding dans lespace de modlisation graphique.

1102

Guide de Rfrence des Composants Talend Open Studio

Scnario: Transformer lencodage des caractres dun fichier

Double-cliquez sur le composant tChangeFileEncoding pour afficher longlet Basic settings de sa vue Component.

Cochez la case Use Custom Input Encoding. Slectionnez le type dencodage GB2312 dans la liste droulante Encoding. Dans le champ Input File Name, parcourez ou saisissez le chemin daccs au fichier dentre. Dans le champ Output File Name, parcourez ou saisissez le chemin daccs au fichier de sortie. Slectionnez CUSTOM dans la liste droulante Encoding, et saisissez UTF-16 dans le champ texte. Sauvegardez votre Job et appuyez sur F6 pour lexcuter.

Le type dencodage du fichier in.txt est transform, et out.txt est gnr avec un type dencodage UTF-16.

Guide de Rfrence des Composants Talend Open Studio

1103

tCreateTemporaryFile

tCreateTemporaryFile

Proprits du tCreateTemporaryFile
Famille du composant Fonction Objectif File/Management Le composant tCreateTemporaryFile permet de crer et dorganiser les fichiers temporaires. Le tCreateTemporaryFile aide la cration dun fichier temporaire et sa redirection dans dossier dfini. Ce composant permet galement de conserver ou de supprimer ce fichier temporaire, selon le cas, aprs lexcution du Job. Remove file when exe- Cochez cette case pour que le fichier temporaire soit supcution is over prim aprs lexcution du Job. Directory Template Suffix Utilisation Renseignez le chemin daccs au dossier o sont stocks les fichiers temporaires. Attribuez un nom au fichier temporaire en respectant le modle. Entrez une extension de fichier pour prciser le format que vous voulez donner au fichier temporaire.

Basic settings

Le composant tCreateTemporaryFile vous donne la possibilit de grer vos fichiers temporaires pour que la mmoire soit libre au profit dautres projets, ce qui permet doptimiser les performances systme. Filepath : retrouve le chemin daccs lemplacement o a t cr le fichier. Disponible comme variable After. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Global Variables

Connections

Liens de sortie (dun composant un autre) : Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : Run if, OnSubjobOk, OnSubjobError, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez leGuide Utilisateur Talend Open Studio.

1104

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un fichier temporaire et y crire des donnes

Scnario : Crer un fichier temporaire et y crire des donnes


Le scnario suivant dcrit un Job simple permettant de crer un fichier temporaire vide dans un dossier dfini, puis dy crire des donnes et enfin de le supprimer aprs lexcution du Job. A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : le tCreateTemporaryFile, le tRowgenerator, le tFileOutputDelimited, le tFileInputDelimited et le tLogRow. Reliez le tCreateTemporaryFile au tRowGenerator laide dun lien de type SubJobOk. Reliez le tRowGenerator au tFileOutputDelimited laide dun lien de type Row Main. Reliez le tRowGenerator au tFileInputDelimited laide dun lien de type SubJobOk. Reliez le tFileInputDelimited au tLogRow laide dun lien de type Row Main.

Dans lditeur graphique, slectionnez le composant tCreateTemporaryFile. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tCreateTemporaryFile.

Cochez la case Remove file when execution is over pour supprimer, aprs lexcution du Job, le fichier temporaire cr. Cliquez sur le bouton [...] ct du champ Directory pour parcourir vos dossiers jusqu celui o seront stocks les fichiers temporaires. Vous pouvez galement entrer directement le chemin daccs.

Guide de Rfrence des Composants Talend Open Studio

1105

Scnario : Crer un fichier temporaire et y crire des donnes

Dans le champ Template, renseignez le nom du fichier temporaire en veillant ce quil respecte le format du modle. Dans le champ Suffix, renseignez lextension du fichier pour indiquer le format que vous voulez donner au fichier temporaire. Dans lditeur graphique, slectionnez le tRowGenerator puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings).

Dans la liste droulante Schema, choisissez le mode Built-In. Cliquez sur le bouton [...] du champ Edit schema pour dfinir les donnes passer au composant tFileOutputDelimited. Dans cet exemple, seules les donnes de la colonne value sont traites.

Cliquez sur OK pour fermer la bote de dialogue. Cliquez sur le bouton [...] du champ RowGenerator Editor pour ouvrir la bote de dialogue de lditeur.

Dans le champ Number of Rows for Rowgenerator, entrez le chiffre 5 pour gnrer cinq lignes puis cliquez sur Ok pour fermer la bote de dialogue. Dans lditeur graphique, slectionnez le tFileOutputDelimited puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings).

1106

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un fichier temporaire et y crire des donnes

Dans la liste droulante Property Type, choisissez le mode Built-In. Cliquez dans le champ File Name puis appuyez simultanment sur Ctrl+Espace pour accder la liste dautocompltion. Pour envoyer les donnes en sortie vers le fichier temporaire cr, slectionnez loption tCreateTemporaryFile_1.FILEPATH dans la liste des variables. Renseignez les sparateurs de lignes et de champs dans leurs champs respectifs Row Separator et Field Separator. Choisissez le mode Built-In dans la liste droulante Schema puis cliquez sur Sync columns pour synchroniser les colonnes dentre et de sortie. Notez que la connexion Row permet dalimenter automatiquement le schma de sortie. Pour plus dinformations sur les types de schmas, consultez le Guide Utilisateur de Talend Open Studio. Dans lditeur graphique, slectionnez le composant tFileInputDelimited. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFileInputDelimited.

Choisissez le mode Built-in dans la liste droulante Property Type. Cliquez dans le champ File Name puis appuyez simultanment sur Ctrl+Espace pour accder la liste dauto-compltion. Pour lire les donnes du fichier temporaire cr, slectionnez tCreateTemporaryFile_1.FILEPATH dans la liste des variables. Renseignez les sparateurs de lignes et de champs dans leurs champs respectifs Row Separator et Field Separator. Dans la liste droulante Schema, choisissez le mode Built-In puis cliquez sur le bouton [...] du champ Edit schema pour dfinir les donnes passer au composant tLogRow. Dans cet exemple, le schma est compos de la seule colonne value. Enregistrez le Job puis appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

1107

Scnario : Crer un fichier temporaire et y crire des donnes

Le fichier temporaire est cr, lors de lexcution du Job, dans le dossier qui a t dfini et les cinq lignes gnres sont inscrites dans ce fichier. Le fichier temporaire est supprim aprs lexcution du Job.

1108

Guide de Rfrence des Composants Talend Open Studio

tFileArchive

tFileArchive

Proprits du tFileArchive
Famille de composant Fonction Objectif Basic settings File/Management Le composant tFileArchive zippe un ou plusieurs fichier(s) en fonction des paramtres dfinis et place larchive cre dans le rpertoire souhait. Ce composant zippe un ou plusieurs fichier(s) pour un ventuel traitement. Directory Rpertoire dans lequel le fichier zipp sera plac. Subdirectories : Cochez cette case si le ou les rpertoire(s) slectionn(s) contiennent des sous-dossiers. Archive file Compress level Rpertoire de destination et nom du fichier archive. Choisissez le niveau de compression que vous souhaitez appliquer. Best : la qualit de compression sera optimale mais le temps de compression sera long. Normal : qualit et temps de compression intermdiaires. Fast : la compression sera rapide mais la qualit de compression sera amoindrie. All files Cochez cette case si vous souhaitez que tous les fichiers du dossier soient zipps. Dcochez-la pour spcifier dans le tableau Files le ou les fichier(s) que vous dsirez zipper. Filemask : entrez un nom de fichier ou masque de fichier utilisant un caractre spcial ou une expression rgulire. Create directory if not Cochez cette case pour crer un nouveau dossier si votre exists dossier de destination nexiste pas. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

Overwrite Existing Ar- Cette case est coche par dfaut. Elle vous permet de chive sauvegarder une archive en remplaant larchive existante. Cependant, si vous dcochez la case, une erreur sera rapporte, le remplacement darchive chouera et la nouvelle archive ne pourra tre sauvegarde. Lorsque le remplacement choue, le Job poursuit son excution. Encrypt files Cochez cette case si vous souhaitez que votre archive soit protge par un mot de passe. Le champ Enter

Guide de Rfrence des Composants Talend Open Studio

1109

Scnario : Zipper des fichiers laide dun tFileArchive

Password apparat et vous permet de saisir votre mot de passe. Advanced settings Utilisation Global Variables tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Ce composant doit tre utilis en standalone. Archive File Path : retrouve le chemin daccs au fichier archive. Disponible comme variable After. Retourne une chane de caractres. Archive File Name : retrouve le nom du fichier archive. Disponible comme variable After. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : Run if, OnSubjobOk, OnSubjobError, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez leGuide Utilisateur Talend Open Studio. Limitation n/a

Scnario : Zipper des fichiers laide dun tFileArchive


Ce scnario met en scne un Job form dun composant unique. Il a pour but de zipper des fichiers et de les enregistrer dans le rpertoire choisi. Cliquez-dposez le composant tFileArchive de la Palette dans lespace de modlisation graphique. Double-cliquez sur le composant afin dafficher sa vue Component.

1110

Guide de Rfrence des Composants Talend Open Studio

Scnario : Zipper des fichiers laide dun tFileArchive

Dans le champ Directory, cliquez sur [...], parcourez votre rpertoire et slectionnez le dossier ou le fichier que vous souhaitez compresser. Cochez la case Subdirectories si vous dsirez inclure dans larchive les fichiers des sous-dossiers. Renseignez ensuite le champ Archive file, en indiquant le rpertoire de destination et le nom de votre archive. Cochez la case Create directory if not exists si votre rpertoire de destination nexiste pas encore et que vous souhaitez le crer. Dans la liste Compress level, slectionnez le niveau de compression que vous dsirez appliquer votre archive. Dans cet exemple, utilisez le niveau normal. Dcochez la case All Files si vous ne souhaitez compresser que des fichiers spcifiques.

Ajoutez une ligne dans le tableau laide du bouton [+], et cliquez sur le nom qui saffiche. Saisissez entre toiles une partie du nom du ou des fichier(s) que vous souhaitez compresser. Appuyez sur F6 afin dexcuter votre Job. Le tArchiveFile a compress les fichiers slectionns et a cr le dossier dans le rpertoire indiqu.

Guide de Rfrence des Composants Talend Open Studio

1111

tFileCompare

tFileCompare

Proprits du tFileCompare
Famille de composant Fonction Objectif Basic settings File/Management Le composant tFileCompare compare deux fichiers et fournit des informations de comparaison (en fonction dun schma en lecture seule). Ce composant permet de contrler la qualit des donnes des fichiers traits. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository mais pour ce composant le schma est en lecture seule. File to compare Reference file Le chemin daccs au fichier vrifier. Le chemin daccs du fichier sur lequel la comparaison est bas.

If differences are detec- Saisissez le message afficher dans la console Run en ted, display If no diffe- fonction du rsultat de la comparaison. rence detected, display Print to console Utilisation Global Variables Cochez cette case pour afficher le message saisi. Ce composant peut tre utilis en standalone mais il est gnralement reli un composant de sortie pour regrouper les informations de comparaison. Difference : Vrifie si deux fichiers sont identiques ou non. Disponible comme variable Flow. Retourne une valeur boolenne : -true si les deux fichiers sont identiques. -false sil y a une (des) diffrence(s) entre eux. Pour plus dinformations concernant les variables, consultez leGuide Utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : Run if, OnSubjobOk, OnSubjobError, OnComponentOk, OnComponentError, Synchronize, Parallelize.

1112

Guide de Rfrence des Composants Talend Open Studio

Scnario : Comparer des fichiers dzipps

Pour plus dinformations concernant les liens, consultez leGuide Utilisateur Talend Open Studio. Limitation n/a

Scnario : Comparer des fichiers dzipps


Ce scnario dcrit un Job permettant de dzipper un fichier et de le comparer avec un fichier de rfrence pour sassurer quil na pas t modifi. La sortie de cette comparaison est stocke dans un fichier dlimit et un message est affich dans la console.

Cliquez et dposez les composants suivants : tFileUnarchive, tFileCompare et tFileOutputDelimited. Reliez les composants tFileUnarchive et tFileCompare laide dune connexion de type Iterate. Connectez le composant tFileCompare au composant de sortie laide dun lien Main row. Dans longlet Basic settings du composant tFileUnarchive, renseignez le chemin daccs au fichier dzipper. Dans le champ Extraction Directory, renseignez le chemin de destination du fichier dzipp. Dans longlet Basic settings du composant tFileCompare, paramtrez les proprits du fichier comparer. Dans le champ File to compare, appuyez sur Ctrl+Espace pour afficher la liste des variables globales. Slectionnez $_globals{tFileUnarchive_1}{CURRENT_FILEPATH} ou "((String)globalMap.get("tFileUnarchive_1_CURRENT_FILEPATH"))" en fonction du langage avec lequel vous travaillez, pour rcuprer le chemin daccs du fichier partir du composant tFileUnarchive.

Puis dans le champ Reference file, paramtrez le fichier de rfrence sur lequel est base la comparaison. Dans les champs If differences detected, display et If no differences detected, dispay, paramtrez les messages afficher lorsque les fichiers sont diffrents et lorsquils sont identiques, par exemple : "[Job " + JobName + "] Files differ" Cohez la case Print to Console, pour que le message dfini apparaisse la fin de lexcution du Job. Le schma est en lecture seule et contient les informations standard. Cliquez sur Edit schema pour le consulter.

Guide de Rfrence des Composants Talend Open Studio

1113

Scnario : Comparer des fichiers dzipps

Puis paramtrez le composant de sortie en utilisant des points-virgules comme sparateurs de donnes. Enregistrez le Job et appuyez sur F6 pour lexcuter.

Le message paramtr apparat dans la console et la sortie contient les informations telles quelles ont t dfinies dans le schma.

1114

Guide de Rfrence des Composants Talend Open Studio

tFileCopy

tFileCopy

Proprits du tFileCopy
Famille de composant Fonction Objectif Basic settings File/Management Le composant tFileCopy fait une copie dun fichier source dans un rpertoire cible et peut supprimer le fichier source, si ncessaire. Ce composant permet de rationnaliser les traitements en effectuant des tches rcurrentes et fastidieuses de manire automatique. File Name Destination Remove source file Replace existing file Utilisation Global Variables Chemin daccs au fichier copier ou dplacer. Chemin daccs du rpertoire dans lequel le fichier est copi ou dplac. Cochez cette case pour dplacer le fichier. Cochez cette case pour craser le fichier dj existant. Destination File Name : retrouve le nom du fichier de destination. Disponible comme variable After. Retourne une chane de caractres. Destination File Path : retrouve le chemin daccs au fichier de destination. Disponible comme variable After. Retourne une chane de caractres. Source Directory : retrouve le chemin daccs au fichier source. Disponible comme variable After. Retourne une chane de caractres. Destination Directory : retrouve le chemin daccs au rpertoire de destination. Disponible comme variable After. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) :

Ce composant peut tre utilis en standalone.

Guide de Rfrence des Composants Talend Open Studio

1115

Scnario : Rcuprer un fichier de la corbeille

Row : Main, Reject, Iterate. Trigger : Run if, OnSubjobOk, OnSubjobError, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a

Scnario : Rcuprer un fichier de la corbeille


Ce scnario dcrit un Job faisant une boucle sur une liste de fichiers, copie chaque fichier du rpertoire source vers le rpertoire cible. Puis il supprime les fichiers copis du rpertoire source.

Cliquez-dposez les composants tFileList et tFileCopy. Reliez-les laide dune connexion Iterate. Dans longlet Basic settings du composant tFileList, spcifiez le rpertoire sur lequel sera effectue la boucle.

Dans le champ Filemask, paramtrez le masque du fichier en *.txt pour ne tenir compte que des fichiers avec cette extension. Dans cet exemple, la casse nest pas prise en compte, ainsi dans la liste droulante Case Sensitive, slectionnez loption No. Puis slectionnez le composant tFileCopy et paramtrez ses proprits dans longlet Basic settings.

Dans le champ File Name, appuyez sur Ctrl+Espace pour accder la liste des variables. Slectionnez la variable globale ((String)globalMap.get("tFileList_1_CURRENT_FILEPATH")). De cette manire, tous les fichiers du rpertoire source peuvent tre traits. Cochez la case Remove Source file pour supprimer le fichier ayant t copi. Cochez la case Replace existing file pour craser tout fichier dj existant dans le rpertoire de destination.

1116

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer un fichier de la corbeille

Enregistrez le Job et appuyez sur F6. Les fichiers sont copis dans le rpertoire de destination et supprims du rpertoire source.

Guide de Rfrence des Composants Talend Open Studio

1117

tFileDelete

tFileDelete

Proprits du tFileDelete
Famille de composant Fonction Objectif Basic settings Utilisation Global Variables File/Management Le composant tFileDelete supprime un fichier dun rpertoire spcifi. Ce composant permet de rationaliser les traitements en effectuant des tches rcurrentes et fastidieuses de manire automatique. File Name Chemin daccs au fichier supprimer. Delete Path : retrouve le chemin daccs lemplacement o se trouvait le fichier supprim. Disponible comme variable After. Retourne une chane de caractres. Current status : indique si un lment a t supprim ou non. Disponible comme variable Flow. Retourne une chane de caractres et le libell de la commande de suppression. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : Run if, OnSubjobOk, OnSubjobError, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a Ce composant peut tre utilis en standalone.

1118

Guide de Rfrence des Composants Talend Open Studio

Scnario : Supprimer des fichiers

Scnario : Supprimer des fichiers


Ce scnario dcrit un Job trs simple supprimant des fichiers dun rpertoire donn.

Cliquez et dposez les composants suivants : tFileList, tFileDelete, tJava. Dans le champ Directory de longlet Basic settings du composant tFileList, spcifiez le rpertoire sur lequel la boucle doit tre effectue.

Dans le champ Filemask, paramtrez le masque de fichier en *.txt. Ne cochez aucune case. Dans longlet Basic settings du composant tFileDelete, paramtrez le champ File Name afin que le fichier slectionn par le composant tFileList soit supprim. Ceci permet de supprimer tous les fichiers dun rpertoire spcifi.

Appuyez sur Ctrl+Espace pour accder la liste des variables globales. En Java, la variable adquate permettant de rcuprer le fichier en cours est : ((String)globalMap.get("tFileList_1_CURRENT_FILEPATH")). Puis dans le composant tJava, dfinissez le message afficher dans la sortie standard (la console Run). Dans cet exemple Java, saisissez le script suivant dans le champ Code : System.out.println( ((String)globalMap.get("tFileList_1_CURRENT_FILE")) + " has been deleted!" ); Puis enregistrez le Job et appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

1119

Scnario : Supprimer des fichiers

Le message dfini dans le composant tJava apparat dans la console pour chaque fichier supprim laide du composant tFileDelete.

1120

Guide de Rfrence des Composants Talend Open Studio

tFileExist

tFileExist

Proprits du tFileExist
Famille du composant Fonction Objectif Basic settings Utilisation Global Variables File/Management Le composant tFileExist vrifie si un fichier existe ou non. Le tFileExists aide rationaliser les processus en automatisant les tches rcurrentes et fastidieuses, comme par exemple vrifier si un fichier existe ou non. File Name Chemin daccs au fichier dont vous voulez vrifier lexistence. Exists : indique si un fichier spcifi existe ou non. Disponible comme variable Flow. Retourne une valeur boolenne : -true si le fichier existe. -false si le fichier nexiste pas. File name : retrouve le nom et le chemin daccs dun fichier. Disponible comme variable After. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : Run if, OnSubjobOk, OnSubjobError, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a

Ce composant peut tre utilis en standalone.

Guide de Rfrence des Composants Talend Open Studio

1121

Scnario : Vrifier lexistence dun fichier et le crer sil nexiste pas

Scnario : Vrifier lexistence dun fichier et le crer sil nexiste pas


Ce scnario dcrit un Job simple qui permet de vrifier si le fichier spcifi existe, dafficher un message lcran si le fichier nexiste pas, de lire les donnes dun autre fichier dentre spcifi et de les crire dans un fichier dlimit en sortie. A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : le tFileExist, le tFileInputDelimited, le tFileOutputDelimited et le tMsgBox. Reliez dabord le tFileExist au tFile InputDelimited laide dun lien de type OnSubjobOk, puis au tMsgBox laide dun lien de type Run If.

Reliez le tFileInputDelimited au tFileOutputDelimite laide dun lien de type Row Main. Dans lditeur graphique, slectionnez le tFileExist puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings).

Dans le champ File name, renseignez le chemin daccs au fichier ou parcourez vos dossiers la recherche du fichier dont vous voulez vrifier lexistence. Dans lditeur graphique, slectionnez le composant tFileInputDelimited puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings).

Remplissez le champ File Name en parcourant vos dossiers jusquau fichier dentre que vous voulez lire.

1122

Guide de Rfrence des Composants Talend Open Studio

Scnario : Vrifier lexistence dun fichier et le crer sil nexiste pas

Si le chemin daccs du fichier contient des caractres caractres accentus, vous obtiendrez un message derreur lors de lexcution du Job. Pour plus dinformations concernant la procdure suivre lorsque les accents ne sont pas supports, consultez le Guide dinstallation Talend Open Studio. Dfinissez les sparateurs de lignes et de champs dans leurs champs respectifs Row separator et Field Separator. Dfinissez le nombre de lignes den-tte (Header), de pied de page (Footer) et le nombre maximal de lignes traiter (Limit) en fonction de vos besoins. Dans ce scnario, notre tableau comporte une ligne den-tte. Dans la liste droulante Schema, choisissez le mode Built-In. Cliquez ensuite sur le bouton [...] du champ Edit schema pour dfinir les donnes passer au composant tFileOutputDelimited. Dfinissez les donnes prsentes dans le fichier lire (file2 dans ce scnario). Pour plus dinformations sur les types de schmas, consultez leGuide Utilisateur de Talend Open Studio.

Le schma du fichier file2 est compos de cinq colonnes : Num, Ref, Price, Quant et Tax. Dans lditeur graphique, slectionnez le composant tFileOutputDelimited. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFileOutputDelimited.

Dfinissez le champ Property Type en mode Built-in. Dans le champ File name, appuyez simultanment sur Ctrl+Espace pour accder la liste des variables et slectionner FILENAME. Dfinissez les sparateurs de lignes et de champs dans leurs champs respectifs Row separator et Field Separator. Cochez la case Include Header car, dans cet exemple, le fichier file2 comprend un en-tte. Dfinissez le champ Schema en mode Built-in puis cliquez sur le bouton Sync columns pour synchroniser le schma du fichier de sortie (file1) avec le schma du fichier dentre (file2).

Guide de Rfrence des Composants Talend Open Studio

1123

Scnario : Vrifier lexistence dun fichier et le crer sil nexiste pas

Dans lditeur graphique, slectionnez le composant tMsgBox. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tMsgBox.

Cliquez sur le lien If pour en afficher les proprits dans la vue Basic settings. Dans le panneau Condition, appuyez simultanment sur Ctrl+Espace pour accder la liste de variable et slectionner EXISTS. Entrez un point dexclamation avant la variable pour en inverser le sens.

Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Une bote de dialogue apparat pour confirmer que le fichier nexiste pas.

1124

Guide de Rfrence des Composants Talend Open Studio

Scnario : Vrifier lexistence dun fichier et le crer sil nexiste pas

Cliquez sur OK pour fermer cette bote de dialogue et continuer lexcution du Job. Le fichier manquant, file1 dans cet exemple, est crit sous la forme dun fichier dlimit lendroit pralablement dtermin.

Guide de Rfrence des Composants Talend Open Studio

1125

tFileInputARFF

tFileInputARFF

Proprits du tFileInputARFF
Famille de composant File/Input Fonction Objectif Le composant tFileInputARFF lit un fichier ARFF ligne ligne et spare des champs simples. Ce composant ouvre un fichier et le lit ligne par ligne afin de le diviser en champs et denvoyer ces champs au composant suivant, comme dfini par le schma, via une connexion Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant connexion de base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio. File Name Chemin daccs et nom du fichier, et/ou variable traiter. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement builtin. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

Basic settings

1126

Guide de Rfrence des Composants Talend Open Studio

Scnario : Afficher le contenu dun fichier ARFF

tStatCatcher Statistics Utilisation

Cochez cette case pour collecter les informations de log au niveau du composant.

Utilisez ce composant pour lire un fichier et sparer les champs laide du sparateur spcifi.

Scnario : Afficher le contenu dun fichier ARFF


Le scnario suivant dcrit un Job form de deux composants ayant pour objectif de lire ligne ligne un fichier ARFF, de slectionner des donnes dlimites et dafficher la sortie dans la console de la vue Run. Un fichier ARFF se prsente comme suit :

Un fichier ARFF est gnralement compos de deux parties : la description de la structure des donnes, correspondant aux lignes qui dbutent par @attribute, et les donnes brutes, qui suivent lexpression @data. Dans lespace de modlisation du studio de Talend Open Studio, crez le Job suivant :

Glissez et dposez le composant tFileInputARFF de la Palette dans lespace de modlisation graphique. Glissez et dposez de la mme manire le composant tLogRow Cliquez-droit sur le composant tFileInputARFF et slectionnez Row > Main dans le menu contextuel. Puis glissez ce lien vers le tLogRow et relchez lorsque le symbole de prise de courant apparat. La transmission du flux de donne entre les deux composants est ainsi tablie. Double-cliquez sur le tFileInputARFF pour paramtrer ce composant. Dans la vue Component, renseignez le champ File Name. Parcourez votre rpertoire de fichiers, afin de slectionner le fichier .arff.

Guide de Rfrence des Composants Talend Open Studio

1127

Scnario : Afficher le contenu dun fichier ARFF

Dans le champ Schema, slectionnez Built-In. Cliquez sur le bouton [...] du champ Edit schema, pour effectuer manuellement la description des colonnes du fichier lu. Cliquez autant de fois sur le bouton que ncessaire pour dcrire chacune des colonnes du fichier lu. Dans cet exemple, 17 colonnes sont ajoutes, nommez-les comme suit :

Pour chacune des colonnes slectionnez le Type : chaine de caractres (String). Cliquez sur OK. Dans lespace de modlisation, double-cliquez sur le composant tLogRow pour afficher sa vue Component. Cliquez sur le bouton [...] du champ Edit schema pour vrifier que le schma a bien t propag. Si ce nest pas le cas, cliquez sur le bouton Sync columns.

1128

Guide de Rfrence des Composants Talend Open Studio

Scnario : Afficher le contenu dun fichier ARFF

Conservez les paramtres par dfaut. Appuyez sur F6 pour excuter votre Job.

La console affiche les donnes contenues dans le fichier ARFF dlimites par une barre verticale (sparateur par dfaut).

Guide de Rfrence des Composants Talend Open Studio

1129

tFileInputDelimited

tFileInputDelimited

Proprits du tFileInputDelimited
Famille de composant File/Input Fonction Objectif Le composant tFileInputDelimited lit un fichier ou un flux de donnes ligne par ligne et spare des champs simples. Ce composant lit un fichier ou un flux de donnes ligne par ligne, afin de le diviser en champs et denvoyer ses champs au composant suivant, comme dfini par le schma, via une connexion Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File name/Stream File name : Chemin daccs et nom du fichier traiter. Stream : Flux de donnes traiter. Les donnes doivent pralablement tre mises en flux afin dtre rcupres par le tFileInputDelimited via la variable reprsentative correspondante. Cette variable peut tre prdfinie dans votre Studio ou fournie par le contexte ou les composants utilis(s) avec ce composant. Sinon, vous pouvez la dfinir manuellement et lutiliser selon votre Job, par exemple laide dun tJava ou dun tJavaFlex. Afin dviter les dsagrments de la saisie, vous pouvez slectionner la variable qui vous intresse dans la liste dautocompltion (Ctrl+Espace) afin de remplir le champ, si cette variable a t correctement dfinie. Pour plus dinformations concernant les variables disponibles, consultez le Guide utilisateur de Talend Open Studio. Row separator Field separator CSV options Chane (ex : \nsous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs. Cochez cette case pour prendre en compte les paramtres spcifiques aux fichiers CSV, notamment la manire de protger les caractres dans le champ Escape char et le type de guillemet dans le champ Enclosure. Nombre de lignes ignorer au dbut dun fichier. Nombre de lignes ignorer la fin dun fichier. Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ni traite.

Basic settings

Header Footer Limit

1130

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileInputDelimited

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement builtin. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Skip empty rows Uncompress as zip file Die on error Cochez cette case pour ignorer les lignes vides. Cochez cette case pour dcompresser le fichier dentre. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

Advanced settings

Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss pour numbers) les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Extract lines at random Cochez cette case pour dfinir le nombre de lignes extraire de faon alatoire. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour supprimer les espaces en dbut et en fin de champ dans toutes les colonnes.

Trim all columns

Check each row struc- Cochez cette case pour synchroniser chaque ligne avec le ture against schema schma dentre. Check date Check columns to trim Cochez cette case afin de vrifier le format de la date strictement par rapport au schma dentre Cochez la case devant le nom de chacune des colonnes dont vous voulez supprimer les espaces de dbut et de fin de champ. Cochez cette case pour sparer les lignes avant de sparer les champs. Cochez cette case pour collecter les donnes de log au niveau du composant.

Split row before field tStatCatcher Statistics Utilisation

Utilisez ce composant pour lire un fichier et sparer les champs laide du sparateur spcifi. Il permet de crer un flux de donnes laide dun lien Row > Main, ainsi

Guide de Rfrence des Composants Talend Open Studio

1131

Scnario 1 : Afficher le contenu dun fichier dlimit

que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet du composant tFileInputXML.

Scnario 1 : Afficher le contenu dun fichier dlimit


Le scnario suivant est un Job de deux composants ayant pour objectif de lire les lignes dun fichier, de slectionner des donnes dlimites et dafficher la sortie dans la console de la vue Run.

Cliquez et dposez un composant tFileInputDelimited de la Palette dans lespace de modlisation. De la mme manire, cliquez et dposez un composant tLogRow. Cliquez-droit sur le composant tFileInputDelimited et slectionnez Row > Main dans le menu contextuel. Puis glissez ce lien vers le tLogRow et relchez lorsque le symbole de prise de courant apparat. Slectionnez le composant tFileInputDelimited nouveau et dfinissez ses proprits dans longlet Basic Settings :

Renseignez le chemin daccs au fichier dans le champ File Name. Ce champ est obligatoire. Si le chemin daccs du fichier contient des caractres accentus, vous obtiendrez un message derreur lors de lexcution du Job. Pour plus dinformations concernant la procdure suivre lorsque les accents ne sont pas supports, consultez Guide dinstallation Talend Open Studio . Dfinissez le sparateur de lignes dans le champ Row separator afin didentifier la fin dune ligne. Puis dfinissez le sparateur de champs dans Field separator pour dlimiter les champs composant une ligne. Dans ce scnario, len-tte (Header) et le pied de page (Footer) nont pas besoin dtre dfinis. Et la limite de lignes lues (Limit ) est de 50 pour cet exemple. Slectionnez soit local (Built-in) soit distant (Repository) comme Schema pour dfinir les donnes qui passent par le composant tLogRow. Vous pouvez charger et/ou diter le schma laide de la fonction Edit Schema. Voir galement le Guide utilisateur de Talend Open Studio.

1132

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Lire les donnes dun fichier distant en mode stream

Assurez-vous que la case Skip empty rows est coche afin dignorer les lignes vierges. Saisissez lencodage utilis dans le fichier dentre. Ce paramtre permet dassurer lhomognit de lencodage dans tous les fichiers dentre et de sortie. Slectionnez le composant tLogRow et dfinissez le sparateur de champs de la sortie affiche. Voir galement la section intitule Proprits du tLogRow . Cochez la case Print schema column name in front of each value pour rcuprer le libell des colonnes dans la sortie affiche. Cliquez sur la vue Run, puis cliquez sur Run pour excuter le Job. Le fichier est lu ligne par ligne et les champs extraits sont affichs dans la console, tel que dfini dans les proprits du composant (dans longlet Basic settings).

La console affiche len-tte suivi des donnes lues par le Job.

Scnario 2 : Lire les donnes dun fichier distant en mode stream


Le scnario suivant illustre un Job quatre composants ayant pour objectif de rcuprer les donnes dun fichier volumineux quasiment aussitt quelles ne sont lues afin dviter lattente du tlchargement de lensemble du fichier de donnes, et les affichent dans la console de la vue Run.

Dposez les composants suivants dans lespace de modlisation : tFileFetch, tSleep, tFileInputDelimited, et tLogRow. Reliez les composants tSleep et tFileInputDelimited via un lien de type Trigger > OnComponentOk et reliez les composants tFileInputDelimited et tLogRow via un lien de type Row > Main. Double-cliquez sur le composant tFileFetch pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits.

Guide de Rfrence des Composants Talend Open Studio

1133

Scnario 2 : Lire les donnes dun fichier distant en mode stream

Dans la liste Protocol, slectionnez le type de protocole vous permettant daccder au serveur sur lequel est stock votre fichier de donnes. Dans le champ URI, saisissez lURI daccs au serveur sur lequel est stock votre fichier. Cochez la case Use cache to save the resource pour mettre les donnes de votre fichier en mmoire cache. Cette option permet dutiliser le mode stream pour transfrer les donnes du fichier. A partir de lespace de modlisation, double-cliquez sur le composant tSleep pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits. Par dfaut, le champ Pause du composant tSleep correspond 1 seconde. Laissez ce paramtre par dfaut. Il met le deuxime Job en pause afin de laisser le temps au premier Job contenant le tFileFetch de lire les donnes du fichier. A partir de lespace de modlisation, double-cliquez sur le composant tFileInputDelimited pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits.

Dans le champ File name/Stream : - Effacez le contenu par dfaut. - Faites un Ctrl+Espace pour faire apparatre la liste des variables disponibles partir de ce composant. Slectionnez la variable tFileFetch_1_INPUT_STREAM dans la liste dautocompltion, la varaible suivante apparat dans le champ Filename : ((java.io.InputStream)globalMap.get("tFileFetch_1_INPUT_STREAM")).

1134

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Lire les donnes dun fichier distant en mode stream

Dans la liste Schema, slectionnez Built-in et cliquez sur le bouton [...] ct du champ Edit schema pour dcrire la structure des donnes du fichier que vous souhaitez rcuprer. Le fichier US_Employees est compos de six colonnes : ID, Employee, Age, Address, State, EntryDate.

Cliquez sur le bouton [+] pour ajouter les six colonnes et paramtrez-les comme indiqu sur la capture dcran ci-dessus. Cliquez sur OK. A partir de lespace de modlisation, double-cliquez sur le composant tLogRow pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits. Cliquez sur Edit schema et assurez-vous que le schma est rcupr du composant prcdent. Sinon, cliquez sur Sync Columns pour le rcuprer. A partir de lespace de modlisation, cliquez sur la vue Job et sur longlet Extra.

Cochez la case Multi thread execution afin dexcuter les deux Jobs en parallle, sachant que le deuxime Job a un retard dune seconde par rapport au premier comme dfini dans le tSleep. Cette option permet donc de rcuprer les donnes grce au tFileDelimited quasiment ds leur lecture par le tFileFetch. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

1135

Scnario 2 : Lire les donnes dun fichier distant en mode stream

Les donnes sont affiches dans la console ds leur lecture.

1136

Guide de Rfrence des Composants Talend Open Studio

tFileInputEBCDIC

tFileInputEBCDIC

Ce composant requiert lutilisation dun JDK Sun.

Proprits du tFileInputEBCDIC
Famille de composant File/Input Fonction Objectif Le composant tFileInputEBCDIC lit un fichier EBCDIC et extrait les donnes en fonction du schma slectionn. Ce composant ouvre un fichier et le lit afin disoler les donnes en fonction des schmas dcrivant la structure de ce fichier et denvoyer ses donnes et schmas au(x) composant(s) suivant(s) via une connexion Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema(s) Data file Xc2j file Advanced settings Utilisation tStatCatcher Statistics Ajoutez les diffrents schmas transmettre en sortie. Slectionnez le fichier EBCDIC contenant les donnes traiter. Slectionnez le fichier xc2j de transformation. Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Utilisez ce composant pour lire un fichier EBCDIC et sparer les donnes en fonction des schmas identifis dans ce fichier.

Scnario : Extraire les donnes dun fichier EBCDIC et alimenter une base de donnes
Ce scnario utilise lassistant [Copybook Connection] guidant lutilisateur travers les diffrentes tapes de cration de connexion au fichier Copybook et de rcupration des schmas EBCDIC. Lassistant [Copybook Connection] est uniquement disponible pour les utilisateurs de Talend Enterprise. Si vous tes utilisateur de Talend Open Studio, vous devez configurer les proprits du composant tFileInputEBCDIC manuellement. Le scnario suivant est un Job de quatre composants ayant pour objectif de lire un fichier au format EBCDIC contenant des informations sur les clients et sur leurs transactions financires, den extraire et de transformer les donnes, et de crer deux tables dans une base de donnes partir des deux schmas, clients et transactions, extraits du fichier EBCDIC dorigine.

Guide de Rfrence des Composants Talend Open Studio

1137

Scnario : Extraire les donnes dun fichier EBCDIC et alimenter une base de donnes

Ce scnario Java utilise lassistant EBCDIC Connection pour crer une connexion au fichier Copybook et gnrer un fichier xc2j permettant de rcuprer et de transformer les diffrents schmas du fichier. Crez une connexion au fichier Copybook dcrivant la structure de votre fichier EBCDIC. Dans ce scnario la connexion Copybook est appele EBCDIC.. Rcuprez le schma du fichier. Une fois la connexion au fichier Copybook cre et les schmas rcuprs laide des assistants EBCDIC et Schema, ils apparaissent sous le nud Metadata > Copybook. Ces nouveaux schmas sappellent Schema01, Schema04 et Schema05.

Pour rcuprer les diffrentes structures du fichier et les utiliser dans Talend Open Studio : A partir du Repository, dposez le schma Schema01 dans lditeur graphique. Cette manipulation crera le composant dentre tFileInputEBCDIC. Dposez le composant tMysqlOutput de la Palette dans lespace de modlisation graphique. Double-cliquez sur le tFileInputEBCDIC pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Les champs Property Type, Schema(s), Data file et Xc2j file sont automatiquement renseigns par les informations de la mtadonne. Le champ Property Type indique la mtadonne utilise pour le composant. Le champ

1138

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire les donnes dun fichier EBCDIC et alimenter une base de donnes

Schema indique quel schma est transmis au composant suivant. Le champ Data file indique le chemin daccs au fichier de donnes EBCDIC. Le champ Xc2j file indique le chemin daccs au fichier permettant dextraire le schma dcrivant la structure du fichier EBCDIC. Si vous tes en mode Built-In, renseignez ces champs manuellement. Dans lditeur graphique, cliquez-droit sur le tFileInputEBCDIC, slectionnez Row > row_Schema01_1 dans le menu contextuel puis cliquez sur le tMysqlOutput pour relier les composants entre eux. Double-cliquez sur le composant tMysqlOutput pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Dans la liste Property Type, slectionnez le mode Repository et cliquez sur le bouton [...] pour slectionner la connexion la base de donnes centralise dans les mtadonnes du Repository. Les champs Host, Port, Database, Username et Password seront renseigns automatiquement. Si vous tes en mode Built-In, renseignez ces champs manuellement. Dans le champ Table, renseignez le nom de la table crer qui contiendra les donnes extraites du fichier EBCDIC. Ici, appelez cette table ebcdic_01. Dans le champ Action on table, slectionnez loption Create table pour crer la table. A ce stade, le Job rcupre le schma Schema01 du fichier EBCDIC et le transmet ainsi que ses donnes correspondantes vers la base de donnes. Vous souhaitez maintenant rcuprer le schma et les donnes du schma Schema04 du fichier EBCDIC, effectuer une transformation sur ces donnes et les transmettre cette mme base de donnes. Pour cela : Cliquez et dposez les composants tMap et tMysqlOutputBulkExec dans lditeur graphique. Double-cliquez sur le composant tFileInputEBCDIC pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Guide de Rfrence des Composants Talend Open Studio

1139

Scnario : Extraire les donnes dun fichier EBCDIC et alimenter une base de donnes

Dans le champ Schema(s), cliquez sur le bouton [+] pour ajouter une ligne. Cliquez sur cette ligne puis sur le bouton [...] qui apparat en fin de champ. Dans la bote de dialogue qui souvre, slectionnez Create schema from repository pour rcuprer le schma dfini dans la mtadonne EBCDIC puis dans la liste droulante, slectionnez le schma Schema04. Cliquez sur OK pour fermer la bote de dialogue. Si vous navez pas rcupr le schma dans les mtadonnes du repository, slectionnez Create schema for built-in, puis spcifiez manuellement le nom et la description de votre schma. Les deux schmas Schema01 et Schema04 apparaissent dans le champ Schema(s) du composant tFileInputEBCDIC. Pour relier les composants entre eux, cliquez-droit sur le tFileInputEBCDIC, slectionnez Row > row_Schema04_1 dans le menu contextuel puis cliquez sur le tMap. Puis cliquez-droit sur le tMap, glissez le lien jusquau tMysqlOutputBulkExec et relchez le bouton. Dans la bote de dialogue qui souvre, indiquez le nom de la sortie ebcdic_04. Double-cliquez sur le tMap pour ouvrir son diteur

1140

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire les donnes dun fichier EBCDIC et alimenter une base de donnes

Slectionnez toutes les colonnes de la table row_Schema04_1 et glissez-les dans la table ebcdic_04. Dans le tableau ebcdic_04 de la zone Schema editor en bas de lditeur, cliquez sur le bouton [+] pour ajouter une colonne au schma. Nommez cette colonne SUM_AG_NUMBER. Dans la table row_Schema04_1 gauche de lditeur, appuyez sur Ctrl puis slectionnez les colonnes CC01404_L_11_MENAG_1_1 et CC01404_AG_CAM_1_1 et glissez-les dans la nouvelle colonne SUM_AG_NUMBER de la table ebcdic_04, et ajoutez le signe + entre les deux colonnes concatnes pour obtenir : row_04_1.CC01404_L_11_MENAG_1_1 + row_04_1.CC01404_AG_CAM_1_1. Cliquez sur OK pour valider vos modifications et fermer lditeur. Dans lditeur graphique, double-cliquez sur le tMysqlOutputBulkExec pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Dans la liste Property Type, slectionnez le mode Repository et cliquez sur le bouton [...] pour slectionner la connexion la base de donnes centralise dans les mtadonnes du Repository. Les champs Host, Port,

Guide de Rfrence des Composants Talend Open Studio

1141

Scnario : Extraire les donnes dun fichier EBCDIC et alimenter une base de donnes

Database, Username et Password seront renseigns automatiquement. Si vous tes en mode Built-In, renseignez ces champs manuellement. Dans le champ Table, renseignez le nom de la table crer qui contiendra les donnes extraites du fichier EBCDIC. Dans le champ Action on table, slectionnez loption Create table pour crer la table. Enregistrez votre Job via Ctrl+S et cliquez sur la vue Run, cochez les cases Statistics et Exec time puis cliquez sur Run pour excuter le Job. Les deux tables ont t cres dans la base de donnes et contiennent la structure ainsi que les donnes, de transactions et clients, du fichier EBCDIC dorigine.

1142

Guide de Rfrence des Composants Talend Open Studio

tFileInputExcel

tFileInputExcel

Proprits du tFileInputExcel
Famille du composant Fonction Objectif File/Input Le composant tFileInputExcel lit un fichier Excel (.xls ou .xlsx) ou un flux de donnes et en extrait les donnes ligne par ligne. Ce composant lit un fichier Excel ou un flux de donnes ligne par ligne pour le scinder en champs et envoie les champs tel que dfinis dans le schma au composant suivant du Job via une connexion Row. Property type Peut tre Built-in ou Repository Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de connexion et enregistrer les paramtres de connexion au fichier Excel que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de fichier, consultez le Guide Utilisateur de Talend Open Studio . File name/Stream File name : Chemin daccs et nom du fichier, et/ou variable traiter. Stream : Flux de donnes traiter. Les donnes doivent pralablement tre mises en flux afin dtre rcupres par le tFileInputExcel via la variable INPUT_STREAM disponible dans la liste dauto-compltion (Ctrl+Espace). Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. All sheets Sheet list Cochez cette case pour traiter toutes les feuilles du fichier Excel. Cliquez sur le bouton [+] pour ajouter de nouvelles lignes la liste de feuilles traiter : Sheet (name or position) : renseignez le nom ou la position de la feuille traiter. Use Regex : cochez cette case si vous utilisez une expression rgulire pour filtrer les feuilles selon un modle. Header Footer Nombre de lignes ignorer au dbut dun fichier. Nombre de lignes ignorer la fin dun fichier.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1143

Proprits du tFileInputExcel

Limit

Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ni traite.

Affect each Cochez cette case pour appliquer les paramtres dfinis sheet(header&footer) dans les champs Header et Footer toutes les feuilles traites. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

First column et Last co- Renseignez lintervalle de colonnes que vous voulez trailumn ter : la position de la premire colonne dans le champ First column et celle de la dernire colonne traiter dans le champ Last column. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss numbers) pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Trim all columns Cochez cette case pour supprimer les espaces en dbut et en fin de champ dans toutes les colonnes. Lorsque cette case est dcoche, le tableau Check column to trim saffiche, vous permettant de slectionner la ou les colonne(s) dont vous souhaitez retirer les espaces de dbut ou de fin. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes.

Encoding

Read real values for Cochez cette case pour lire les nombres en valeur relle. numbers Stop to read on empty Cochez cette case pour ignorer les lignes vides. rows Dont validate the cells Cochez cette case pour ne pas effectuer de validation des donnes. Ignore the warning tStatCatcher Statistics Cochez cette case pour ignorer les avertissements gnrs par des erreurs sur le fichier Excel. Cochez cette case pour collecter les donnes de log au niveau du composant.

1144

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Utilisation

Utilisez ce composant pour lire un fichier Excel (.xls ou .xlsx) et sparer les champs en fonction dun schma dfini. Ce composant permet de crer un flux de donnes laide dun lien Row > Main, ainsi que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet du composant tFileInputXML.

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

1145

tFileInputFullRow

tFileInputFullRow

Proprits du tFileInputFullRow
Famille du compo- File/Input sant Fonction Objectif Le composant tFileInputFullRow lit un fichier donn ligne par ligne. Le tFileInputFullRow ouvre un fichier quil lit ligne par ligne et passe les lignes compltes au composant suivant comme dfini dans le schma, via une connexion de type Row. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant tFileInputFullRow prcdent. File Name Chemin daccs et nom du fichier, et/ou variable traiter. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Row separator Header Footer Limit Skip empty rows Die on error Chane (ex : \n sous Unix) sparant les lignes. Nombre de lignes ignorer en dbut de fichier. Nombre de lignes ignorer la fin dun fichier. Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ni traite. Cochez cette case pour ignorer les lignes vides. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant. Cochez cette case pour dfinir le nombre de lignes extraire de faon alatoire.

Basic settings

Advanced settings

Encoding

tStatCatcher Statistics Extract lines at random Utilisation

Utilisez ce composant pour lire des lignes compltes dans un fichier dlimit pouvant tre trs gros. Ce composant permet de crer un flux de donnes laide dun lien Row > Main, ainsi que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet du composant tFileInputXML.

1146

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lire des lignes compltes dans un fichier dlimit

Scnario : Lire des lignes compltes dans un fichier dlimit


Le scnario suivant cre un Job deux composants permettant de lire des lignes compltes partir dun fichier et dafficher les donnes de sortie dans la console de log Run. A partir de la Palette, cliquez-dposez les composants tFileInputFullRow et tLogRow dans lditeur graphique. Cliquez-droit sur le composant tFileInputFullRow et connectez-le au tLogRow laide dun lien de type Row Main.

Dans lditeur graphique, slectionnez le composant tFileInputFullRow. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFileInputFullRow.

Dans longlet Basic settings, configurez le champ Schema en mode Built-In. Cliquez sur le bouton [...] du champ Edit schema pour voir les donnes passer au composant tLogRow. Notez que le schma est en read-only et ne comporte quune seule colonne, line.

Dans le champ File Name, renseignez le chemin daccs au fichier traiter ou cliquez sur le bouton [...]. Ce champ est obligatoire. Dans ce scnario, le fichier lire sappelle test5 et comporte trois lignes comprenant chacune deux champs spars par un point-virgule. Dans le champ Row separator, renseignez le sparateur permettant didentifier les fins de ligne.

Guide de Rfrence des Composants Talend Open Studio

1147

Scnario : Lire des lignes compltes dans un fichier dlimit

Dans la champ Header, indiquez la valeur 1. Dans ce scnario, ni le pied-de-page ni le nombre de lignes traiter ne sont renseigns. Dans lditeur graphique, slectionnez le tLogRow puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Pour plus dinformations, consultez la section intitule tLogRow . Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Le composant tFileInputFullRow lit les trois lignes une une sans tenir compte des sparateurs de champs et les lignes compltes apparaissent dans la console Run. Pour extraire des lignes uniquement les champs, utilisez le tExtractDelimitedFields, le tExtractPositionalFields et le tExtractRegexFields. Pour plus dinformations, consultez la section intitule tExtractPositionalFields , la section intitule tExtractRegexFields , .

1148

Guide de Rfrence des Composants Talend Open Studio

tFileInputJSON

tFileInputJSON

Proprits du tFileInputJSON
Famille de composant Fonction Objectif File Le composant tFileInputJSON lit un fichier JSON et extrait les donnes en fonction du schma slectionn. Ce composant ouvre un fichier et le lit afin disoler les donnes en fonction des schmas dcrivant la structure de ce fichier et denvoyer ses donnes et schmas au(x) composant(s) suivant(s) via une connexion Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement.. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement leGuide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement leGuide utilisateur de Talend Open Studio. Use URL Cochez cette case pour rcuprer les donnes directement partir dinternet. URL : entrez le chemin daccs lURL partir de laquelle rcuprer les donnes. Filename Mapping Nom du fichier partir duquel rcuprer les donnes. Column : reflte le schma tel quil est dfini dans lditeur Edit Schema. JSONPath Query : Saisissez les champs extraire de la structure JSON dentre. Advanced settings Advanced separator Cochez cette option pour modifier les sparateurs utili(for numbers) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1149

Scnario : Extraire les donnes des champs dun fichier au format JSON

est obligatoire pour la manipulation des donnes des bases de donnes. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Utilisez ce composant pour lire un fichier JSON et sparer les donnes en fonction des schmas identifis dans ce fichier. n/a

Scnario : Extraire les donnes des champs dun fichier au format JSON
Ce scnario est de deux composants et permet de lire un fichier au format JSON et den extraire les donnes.

Glissez les composants tFileInputJSON de la famille File et tLogRow de la famille Logs & Errors partir de la Palette dans le Job designer. Reliez les composants entre eux via des connexions de type Main > Row. Double-cliquez sur le composant tFileInputJSON pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

Si votre schma est dj stock sous le noeud Db Connections dans le Repository, slectionnez loption Repository dans le champ Schema Type puis choisissez les mtadonnes appropries partir de la liste. Si vous navez encore dfini aucun schma, slectionnez loption Built-in et renseignez manuellement les informations de connexion et la structure des donnes dans un schma. Cliquez sur le bouton [...] du champ Edit schema pour ouvrir une bote de dialogue dans laquelle vous pouvez dfinir le schma afficher en sortie. Cliquez sur le bouton OK pour fermer la bote de dialogue. Dans la zone Mapping, les lments du champ Column sont alors renseigns automatiquement selon le schma que vous venez de dfinir. Dans cet exemple, le schma comporte quatre colonnes FirstName, LastName, Address et City.

1150

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire les donnes des champs dun fichier au format JSON

Dans le champ Filename, renseignez le chemin daccs au fichier JSON dont vous voulez rcuprer les donnes. Si les donnes sont stockes distance sur Internet, cochez la case Use URL puis, de la mme faon, renseignez lURL daccs au fichier traiter. Dans cet exemple, le fichier trait se prsente comme suit :

Dans la zone Mapping, les lignes du champ Column sont dj renseignes. Pour chacune delle, indiquez dans le champ JSONPath query le niveau de larborescence sur lequel rcuprer les donnes. Dans le Job designer, double-cliquez sur le composant tLogRow pour paramtrer ses proprits dans longlet Basic settings de la vue Component.

Cliquez sur le bouton Sync Columns pour rcuprer le schma du composant prcdent. Enregistrez le Job et appuyez sur F6 pour lxecuter.

Le Job retourne les informations du client selon les paramtres slectionns dans le schma.

Guide de Rfrence des Composants Talend Open Studio

1151

tFileInputLDIF

tFileInputLDIF

Proprits du tFileInputLDIF
Famille du compo- File/Input sant Fonction Objectif Basic settings Le composant tFileInputLDIF lit un fichier LDIF donn ligne par ligne. Le tFileInputLDIF ouvre un fichier quil lit ligne par ligne et passe les lignes compltes au composant suivant comme dfini dans le schma, via une connexion de type Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Chemin daccs et nom du fichier, et/ou variable traiter. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. add operation as prefix Cochez cette case pour afficher le mode doprations effecwhen the entry is modify tues. type Value separator Saisissez le sparateur requis pour dcouper les donnes dans un fichier donn. Par dfaut, le sparateur utilis est ,. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant tFileInputLDIF prcdent. Advanced settings Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Schema et Edit Schema

tStatCatcher Statistics

1152

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Utilisation

Utilisez ce composant pour lire des lignes compltes dans un fichier dlimit pouvant tre trs gros. Ce composant permet de crer un flux de donnes laide dun lien Row > Main, ainsi que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet du composant tFileInputXML.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Ecrire des donnes dans un fichier LDIF .

Guide de Rfrence des Composants Talend Open Studio

1153

tFileInputMail

tFileInputMail

Proprits du tFileInputMail
Famille de composant Fonction Objectif Basic settings File/Input Le composant tFileInputMail lit len-tte et le contenu du fichier e-mail dfini. Ce composant permet dextraire les donnes standard des e-mails. File name Entrez le fichier email source. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma dans cette vue, le schma devient automatiquement ponctuel (built-in). Cliquez sur Sync columns pour rcuprer le schma partir du composant prcdent dans le Job. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement leGuide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement leGuide utilisateur de Talend Open Studio. Attachment export di- Renseignez le chemin daccs au rpertoire dans lequel rectory exporter les pices jointes. Mail parts Column : Ce champ est automatiquement renseign avec les colonnes dfinies dans le schma que vous avez propag. Mail part : Saisissez ltiquette den-tte ou de corps de message afficher dans la sortie. Multi value : Cochez cette case pour chaque colonne comportant des champs valeurs multiples. Field separator : Saisissez le sparateur de valeur des champs valeurs multiples. Die on error Cochez cette case pour arrter lexcution du Job lorsquune erreur survient. Dcochez la case pour la ligne en erreur et terminer le processus avec les lignes sans erreur. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Advanced settings Utilisation Limitation

tStatCatcher Statistics

Ce composant traite un flux de donnes et par consquant requiert un composant de sortie. n/a

1154

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire des champs cls dun email

Scnario : Extraire des champs cls dun email


Ce scnario est constitu de deux composants et a pour objectif dextraire certains champs cls et den afficher les valeurs dans la console Run.

Cliquez et dposez les composants tFileInputMail et tLogRow. Reliez les composants laide dun lien de type Row Main. Double-cliquez sur le composant tFileInputMail pour afficher longlet Basic settings de la vue Component et configurer les paramtres de base :

Dans le champ File Name, slectionnez le fichier email traiter. Renseignez manuellement le chemin daccs ou cliquez sur le bouton [...] pour parcourir vos dossiers jusquau fichier choisi. Cliquez sur le bouton [...] ct du champ Edit schema pour ouvrir la bote de dialogue permettant de dfinir le schma afficher en sortie. Dfinissez votre schma en incluant toutes les colonnes que vous souhaitez retrouver dans le flux de sortie. Dans cet exemple, le schma comporte quatre colonnes Date, Author, Object et Status. Une fois dfini, cliquez sur OK pour fermer la bote de dialogue et propager le schma dans le tableau Mail parts. Dans la colonne Mail part du tableau, saisissez les cls standards des parties header (en -tte) et body (corps de message) qui seront utilises pour retrouver les valeurs envoyer en sortie. Cochez la case Multi Value pour chacune des cls standards pouvant se retrouver plus dune fois dans votre fichier dentre. Dfinissez si besoin un sparateur pour les valeurs de ces cls dans le champ Separator. Double-cliquez sur le composant tLogRow pour afficher longlet Basic settings de la vue Component et configurer les paramtres de base. Dfinissez le composant tLogRow afin que les valeurs affiches soient spares par un retour chariot. Sous Windows, saisissez \n entre guillemets doubles. Pour plus dinformations sur le composant tLogRow, consultez la section intitule tLogRow . Enregistrez votre Job puis appuyez sur F6 pour lexcuter et afficher le flux de sortie dans la console de la vue Run Job.

Guide de Rfrence des Composants Talend Open Studio

1155

Scnario : Extraire des champs cls dun email

Les valeurs cls den-tte sont extraites comme spcifi dans le tableau Mail parts. En effet, la date de rception, lauteur, le sujet ainsi que les diffrents statuts contenus dans lemail sont affichs.

1156

Guide de Rfrence des Composants Talend Open Studio

tFileInputMSDelimited

tFileInputMSDelimited

Proprits du tFileInputMSDelimited
Famille du compo- File/Input sant Fonction Objectif Le composant tFileInputMSDelimited permet de lire des fichiers dlimits multi structure complexes. Le tFileInputMSDelimited ouvre le fichier multi structure complexe, en lit la structure (schmas) puis utilise des liens de type Row pour envoyer les champs, tels quils ont t dfinis dans les diffrents schmas, vers les composants suivants dans le Job. Multi Schema Editor Lditeur de schmas [Multi Schema Editor] permet de construire et de configurer le flux de donnes dans un fichier dlimit multi structure pour pouvoir associer un schma pour chaque sortie. Pour plus dinformations, consultez la section intitule Lditeur de schmas Multi Schema Editor . Output Les schmas dfinis dans lditeur de schmas [Multi Schema Editor], ainsi que les types denregistrements correspondants, saffichent automatiquement dans le tableau Output. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Cochez cette case pour supprimer les espaces en dbut et en fin de champ dans toutes les colonnes. Cochez cette case pour vrifier strictement le format de la date par rapport au schma dentre.

Basic settings

Die on error

Advanced settings

Trim all columns Validate date

Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss pour numbers) les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisez ce composant pour lire des fichiers dlimits multi structure et dfinissez un sparateur de champs pour diffrencier les champs contenus dans ces fichiers.

Lditeur de schmas Multi Schema Editor


Lditeur [Multi Shema Editor] vous permet de dfinir :

Guide de Rfrence des Composants Talend Open Studio

1157

Proprits du tFileInputMSDelimited

le chemin daccs au fichier source, les proprits du fichier source, la structure des donnes pour chacun des schmas de sortie. Lorsque vous dfinissez la structure de chaque schma de sortie dans le [Multi Schema Editor], le nom des colonnes des diffrentes structures saffichent automatiquement dans la liste du schma dentre des composants qui suivent le tFileInputMSDelimited. Vous pouvez cependant dfinir la structure des donnes directement dans la vue Basic settings de chacun de ces composants. Le [Multi Schema Editor] permet galement de slectionner un schma qui servira de source (cl primaire) aux donnes entrantes, afin den assurer lunicit. Lditeur utilise ce procd de mapping pour associer tous les schmas traits dans le fichier dlimit au schma source de ce mme fichier. Lditeur souvre en affichant par dfaut la premire colonne. Cette colonne contient gnralement lindicateur de type des enregistrements. Une fois ouvert, vous pouvez cependant dfinir comme cl primaire nimporte quelle colonne du schma en cochant la case associe. Limage ci-dessous donne un aperu de lditeur de schmas [Multi Schema Editor].

1158

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lecture dun fichier dlimit multi structure

Pour des informations plus dtailles sur le Multi Schema Editor, consultez la section intitule Scnario : Lecture dun fichier dlimit multi structure .

Scnario : Lecture dun fichier dlimit multi structure


Le prsent scnario sert crer un Job en Java permettant de lire trois schmas dans un mme fichier dlimit et den afficher la structure sur la console de la vue Run. Le fichier dlimit trait dans ce scnario se prsente comme suit :

A partir de la Palette, cliquez sur les composants suivants et dposez-les dans lditeur graphique : un composant tFileInputMSDelimited et trois tLogRow. Double-cliquez sur le tFileInputMSDelimited pour ouvrir lditeur Multi Schema Editor.

Cliquez sur le bouton Browse... ct du champ File name pour indiquer o se trouve le fichier dlimit multi-schma que vous voulez traiter. Dans la zone File Settings, renseignez : -le type dencodage de votre fichier source, partir de la liste droulante. Cette option permet de garantir une certaine cohrence entre tous les fichiers dentre et de sortie. -les sparateurs de champ et de ligne utiliss dans le fichier source. Cochez la case Use Multiple Separator et configurez les champs qui suivent si diffrents sparateurs de champs sont utiliss pour sparer les schmas du fichier source. Un aperu des donnes du fichier source apparat automatiquement dans le panneau daffichage Preview.

Guide de Rfrence des Composants Talend Open Studio

1159

Scnario : Lecture dun fichier dlimit multi structure

La colonne Column 0, qui contient gnralement lindicateur de type des enregistrements est slectionne par dfaut. Vous pouvez cependant dfinir nimporte quelle autre colonne comme cl primaire en cochant sa case associe. Cliquez sur le bouton Fetch Codes droite du panneau Preview pour cataloguer les types de schmas et les enregistrements du fichier source. Dans ce scnario, le fichier source comporte trois types de schmas (A, B, C). A partir du panneau daffichage Fetch Codes, cliquez sur chacun des trois types pour que la structure de leurs donnes saffiche dans le panneau Preview. Cliquez dans les cellules de la ligne Name et choisissez le nom des colonnes de chacun des schmas slectionns. Dans ce scnario, les colonnes se lisent comme suit : -Schma A : Type, DiscName, Author, Date, -Schma B : Type, SongName, -Schma C : Type, LibraryName.

1160

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lecture dun fichier dlimit multi structure

Vous devez prsent dfinir, partir des donnes dentre, la cl primaire qui permettra de conserver leur unicit (dans ce scnario, il sagit de DiscName). Il vous faut pour cela : Slectionner, partir du panneau daffichage Fetch Codes, le schma contenant la colonne que vous voulez dfinir comme cl primaire (dans ce scnario, il sagit du schma A) pour en afficher la structure. Cliquer dans la cellule Key correspondant la colonne DiscName et cocher la case qui saffiche alors.

Cliquer nimporte o dans lditeur pour que la mention false, dans la case Key, devienne true. Vous devez maintenant indiquer le schma pre auquel vous voulez rattacher les autres schmas fils (dans ce scnario, il sagit de DiscName). Il vous faut pour cela : Slectionner le schma B, partir du panneau daffichage Fetch Codes, puis cliquer sur le bouton flche droite pour le dplacer vers la droite. Faire de mme pour le schma C.

Le champ Cardinality nest pas obligatoire. Il vous permet de dterminer le nombre (ou lintervalle) de champs des schmas fils rattachs au schma pre. Cependant, si vous entrez un nombre ou un intervalle inexact et essayez dexcuter le Job, un message derreur apparatra. Dans le [Multi Schema Editor], cliquez sur le bouton OK pour valider tous les changements que vous venez deffectuer et fermer lditeur de schmas. Les trois schmas dfinis, ainsi que les types denregistrements correspondants, saffichent automatiquement dans la vue Basic settings du composant tFileInputMSDelimited.

Guide de Rfrence des Composants Talend Open Studio

1161

Scnario : Lecture dun fichier dlimit multi structure

Dans lditeur graphique, effectuez un clic-droit sur le composant tFileInputMSDelimited et connectez-le aux trois autres composants tLogRow1, tLogRow2 et tLogRow3 laide des liens respectifs row_A_1, row_B_1 et row_C_1.

Les trois schmas que vous avez dfinis dans lditeur [Multi Schema Editor] sont automatiquement communiqus aux trois composants tLogRow. Si ncessaire, cliquez sur le bouton Edit schema dans la vue Basic settings de chacun des composants tLogRow pour avoir un aperu des structures de donnes en entre et en sortie, telles que vous les avez dfinies dans le Multi Schema Editor, ou pour les modifier.

1162

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lecture dun fichier dlimit multi structure

Enregistrez votre Job puis appuyez sur F6 pour lexcuter. Le fichier dlimit multi-schma est lu ligne par ligne et les champs extraits sont affichs dans la console Run Job comme dfini dans le [Multi Schema Editor].

Guide de Rfrence des Composants Talend Open Studio

1163

tFileInputMSPositional

tFileInputMSPositional

Proprits du tFileInputMSPositional
Famille du composant File/Input Fonction Objectif Le composant tFileInputMSPositional permet de lire des schmas multiples partir dun fichier positionnel. Le tFileInputMSPositional ouvre le fichier multi structure complexe, en lit la structure (schmas) puis utilise des liens de type Row pour envoyer les champs, tels quils ont t dfinis dans les diffrents schmas, vers les composants suivants dans le Job. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Chemin daccs et nom du fichier, et/ou variable traiter. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Row separator Chane de caractres (ex : \n sous Unix) sparant les lignes.

Basic settings

Schema Identifier Field Position de la chane de caractres identifiant les diffrents Position schmas. Records Schema : dfinissez autant de schmas que ncessaire. Schema Identifier value : valeur de la chane de caractres identifiant les diffrents schmas. Saisissez le nom de la colonne. Pattern : Chane de caractres reprsentant la longueur de chacune des colonnes du schma correspondant, spares par des virgules. Vrifiez que les valeurs dfinies dans ce champ sont cohrentes avec le schma dfini. Reject incorrect row size : cochez les cases des schmas pour lesquels vous nacceptez pas une taille de ligne incorrecte. Parent key column : Saisissez le nom de la colonne cl parente. Key column : Saisissez le nom de la colonne cl. Skip from header Skip from footer Limit Nombre de lignes ignorer au dbut du fichier. Nombre de lignes ignorer la fin du fichier. Nombre maximal de lignes traiter. Si Limit = 0, aucune ligne ne sera lue ni traite.

1164

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Die on parse error

Dcochez cette case pour passer les lignes contenant des erreurs de parse et terminer le traitement avec les lignes sans erreur.

Die on unknown header Dcochez cette case pour passer les lignes dont le type dentype tte est inconnu et terminer le traitement avec les lignes sans erreurs. Advanced settings Process long rows (needed Cochez cette case afin de pouvoir traiter de longues lignes for processing rows long- (ceci est ncessaire pour traiter des lignes contenant plus de ger than 100,000 charac- 100 000 caractres). ters wide) Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss numbers) pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Trim all columns Validate date Encoding Cochez cette case pour supprimer les espaces en dbut et en fin de champ dans toutes les colonnes. Cochez cette case pour vrifier strictement le format de la date par rapport au schma dentre. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics

Utilisation

Utilisez ce composant pour lire un fichier positionnel multi-schma et servez-vous dune valeur spcifiant lemplacement pour sparer les champs. Ce composant permet de crer un flux de donnes laide dun lien Row > Main, ainsi que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet du composant tFileInputXML.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Lecture dun fichier dlimit multi structure du composant tFileInputMSDelimited.

Guide de Rfrence des Composants Talend Open Studio

1165

tFileInputMSXML

tFileInputMSXML

Proprits du tFileInputMSXML
Famille du composant Fonction Objectif XML ou File/Input Le composant tFileInputMSXML permet de lire des schmas multiples partir dun fichier XML structur et de les restituer en sortie. Le tFileInputMSXML ouvre le fichier multi structure complexe, en lit la structure (schmas) puis utilise des liens de type Row pour envoyer les champs, tels quils ont t dfinis dans les diffrents schmas, vers les composants suivants dans le Job. File Name Chemin daccs et nom du fichier, et/ou variable traiter. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Root XPath query Racine de larborescence XML sur laquelle se base la requte.

Basic settings

Enable XPath in column Cochez cette case si vous souhaitez dfinir un chemin Schema XPath loop XPath dans le champ Schema XPath loop du tableau But lose the order Outputs. Cette option nest disponible quavec le mode de gnration dom4j . Vrifiez donc que ce mode a bien t slectionn dans la liste Generation mode dans longlet Advanced settings de votre composant. Si vous utilisez cette option, les donnes ne seront pas retournes dans lordre. Outputs Schema : dfinissez autant de schmas que ncessaire. Schema XPath loop : nud ou chemin XPath de larborescence XML sur lequel la boucle est base. Si vous souhaitez utiliser un chemin XPath dans le champ Schema XPath loop , vous devez pralablement cocher la case Enable XPath in column Schema XPath loop but lose the order . XPath Queries : renseignez les champs extraire de la structure XML dentre. Create empty row : cochez les cases des schmas pour lesquels vous voulez crer des lignes vides. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traite-

1166

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lecture dun fichier XML multi structur

ment avec les lignes sans erreurs, et ignorer les lignes en erreur. Advanced settings Trim all column Validate date Ignore DTD file Generation mode Encoding Cochez cette case pour supprimer les espaces en dbut et en fin de champ dans toutes les colonnes. Cochez cette case pour vrifier strictement le format de la date par rapport au schma dentre. Cochez cette case afin d'ignorer le fichier DTD indiqu dans le fichier XML trait. Slectionnez le mode de gnration dans la liste. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics

Limitation

n/a

Scnario : Lecture dun fichier XML multi structur


Le prsent scnario sert crer un Job en Java permettant de lire un fichier XML multi-schma et den afficher la structure sur la console de la vue Run. Le fichier XML trait dans ce scnario se prsente comme suit :

Cliquez et dposez le composant tFileInputMSXML et deux composants tLogRow dans lditeur graphique. Double-cliquez sur le tFileInputMSXML pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Guide de Rfrence des Composants Talend Open Studio

1167

Scnario : Lecture dun fichier XML multi structur

Dans le champ File Name, slectionnez le fichier XML que vous souhaitez traiter. Dans le champ Root XPath query, indiquez la racine de larborescence XML sur laquelle sera base la requte. Cochez la case Enable XPath in column Schema XPath loop But lose the order si vous souhaitez dfinir un chemin XPath dans le champ Schema XPath loop du tableau Outputs. Dans ce scnario, vous nutilisez pas cette option. Cliquez sur le bouton [+] pour ajouter des lignes au tableau Outputs dans lesquelles vous pouvez dfinir les schmas de sortie. Dans le tableau Outputs, cliquez dans chaque cellule Schema et cliquez sur le bouton [...] pour saisir le nom du schma dans la bote de dialogue qui souvre.

Saisissez le nom du schma de sortie et cliquez sur OK. Lditeur de schma du tFileInputMSXML apparat. Dfinissez le schma dj dfini dans le tableau Outputs. Effectuez cette procdure pour chaque schma de sortie que vous crez. Dans ce scnario, lobjectif est de dfinir deux schmas de sortie : record et book. Dans lditeur graphique, cliquez-droit sur le tFileInputMSXML et connectez-le aux tLogRow1 et tLogRow2 laide des liens record et book.

1168

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lecture dun fichier XML multi structur

Dans la vue Basic settings et dans la cellule Schema XPath loop, indiquez le noeud de larborescence XML sur laquelle sera base la requte. Dans la cellule XPath Queries, indiquez les champs extraire du fichier XML dentre. Cochez les cases Create empty row ct des noms des schmas dans lesquels vous souhaitez crer des lignes vides. Enregistrez votre Job et appuyez sur F6 pour lancer son excution. Les schmas spcifis sont extraits du fichier XML multi-schma et sont affichs dans la console. Le fichier XML multi-schma est lu ligne par ligne et les champs extraits sont affichs dans la console de la vue Run.

Guide de Rfrence des Composants Talend Open Studio

1169

tFileInputPositional

tFileInputPositional

Proprits du tFileInputPositional
Famille de composant File/Input Fonction Objectif Le composant tFileInputPositional lit un fichier ou un flux de donnes ligne par ligne et extrait les champs selon un modle (pattern). tFileInputPositional lit un fichier ou un flux de donnes ligne par ligne, spare les champs tels que dfinis par le schma et passe les donnes extraites au composant suivant via une connexion de type Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors prremplis laide des donnes collectes. File name/Stream File name : Chemin daccs et nom du fichier traiter. Stream : Flux de donnes traiter. Les donnes doivent pralablement tre mises en flux afin dtre rcupres par le tFileInputPositional via la variable reprsentative correspondante. Cette variable peut tre prdfinie dans votre Studio ou fournie par le contexte ou les composants utilis(s) avec ce composant, par exemple la variable INPUT_STREAM du tFileFetch. Sinon, vous pouvez la dfinir manuellement et lutiliser selon votre Job, par exemple laide dun tJava ou dun tJavaFlex. Afin dviter les dsagrments de la saisie, vous pouvez slectionner la variable qui vous intresse dans la liste dautocompltion (Ctrl+Espace) afin de remplir le champ, si cette variable a t correctement dfinie. Pour plus dinformations concernant les variables disponibles, consultez leGuide utilisateur de Talend Open Studio. Pour plus dinformations concernant les flux dentre consultez la section intitule Scnario 2 : Lire les donnes dun fichier distant en mode stream . Row separator Chane (ex : \n sous Unix) sparant les lignes. Use byte length as the Cochez cette case pour permettre la prise en charge des cacardinality ractres deux octets dans ce composant. Pour cette fonction, JDK 1.6 est requis. Customize Cochez cette case pour personnaliser le format des donnes du fichier positionnel et renseignez les colonnes du tableau Formats.

Basic settings

1170

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileInputPositional

Column : Slectionnez la colonne que vous souhaitez personnaliser. Size : Saisissez la taille correspondant la colonne. Padding char : Saisissez entre guillemets le caractre de remplissage utilis afin quil soit supprim de votre champ. Le caractre par dfaut est un espace. Alignment : Slectionnez le paramtre dalignement appropri. Pattern Longueurs spares par des virgules, interprtes comme une chane de caractres entre guillemets. Vrifiez que les valeurs saisies dans ce champ sont cohrentes avec le schma dfini. Cochez cette case pour ignorer les lignes vides. Cochez cette case pour dcompresser le fichier dentre. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject. Nombre de lignes ignorer au dbut dun fichier. Nombre de ligne ignorer la fin dun fichier. Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ni traite. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant. Voir galement leGuide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement leGuide utilisateur de Talend Open Studio. Advanced settings Needed to process rows Cochez cette case si les lignes traiter dans le fichier dentre longer than 100 000 cha- font plus de 100 000 caractres de long. racters Advanced separator (for Cochez cette case pour modifier les sparateurs utiliss pour numbers) les nombres : Thousands separator : configurez le sparateurs des milliers. Decimal separator : configurez le sparateur pour les dcimaux. Trim all columns Cochez cette case pour supprimer les espaces en dbut et en fin de champ dans toutes les colonnes.

Skip empty rows Uncompress as zip file Die on error

Header Footer Limit Schema et Edit Schema

Guide de Rfrence des Composants Talend Open Studio

1171

Scnario : Transformer un fichier positionnel en fichier XML

Check columns to trim

Cochez la case devant le nom de chacune des colonnes dont vous souhaitez supprimer les espaces de dbut et de fin de champ. Cochez cette case pour vrifier strictement le format de la date par rapport au schma dentre. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Validate date Encoding

tStatCatcher Statistics Utilisation

Utilisez ce composant pour lire un fichier et sparer les champs laide du sparateur spcifi. Ce composant permet de crer un flux de donnes laide dun lien Row > Main, ainsi que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet du composant tFileInputXML.

Scnario : Transformer un fichier positionnel en fichier XML


Le scnario suivant construit un Job avec deux composants, qui a pour objectif de lire les donnes dun fichier positionnel en entre et de rendre des donnes slectionnes en sortie (selon leur position) dans un fichier XML. Contract 00001 00001 00002 00002 CustomerRef 8200 8201 8202 8203 InsuranceNr 50330 50331 50332 50333

Dposer et relier les composants

1. Cliquez et dposez un composant tFileInputPositional de la Palette dans lespace de modlisation. 2. Cliquez-dposez un composant tFileOutputXML. Ce fichier recevra les rfrences de manire structure. 3. Cliquez-droit sur le composant tFileInputPositional et slectionnez une connexion Row > Main. Glissez cette connexion vers le composant tFileOutputXML et relchez la souris lorsque le symbole de prise de courant apparat.

Configurer les donnes d'entre


1. Slectionnez le composant tFileInputPositional pour afficher sa vue Basic settings et dfinir ses proprits.

1172

Guide de Rfrence des Composants Talend Open Studio

Scnario : Transformer un fichier positionnel en fichier XML

2. Les proprits de ce Job sont de type Built-in pour ce scnario. Par consquent, les informations de proprits sont renseignes pour ce Job seulement et ne peuvent tre rutilises pour un autre Job, contrairement des proprits de type Repository. 3. Renseignez le chemin daccs au fichier dans le champ File Name. Ce champ est obligatoire. 4. Puis dfinissez le sparateur de lignes (Row separator) permettant didentifier la fin de la ligne : le retour chariot par dfaut. 5. Si ncessaire, cochez la case Use byte length as the cardinality pour permettre la prise en charge des caractres deux octets. 6. Puis dans le champ Pattern dfinissant les champs dune ligne. Le pattern est une srie de longueurs correspondant aux valeurs de champs du fichier en entre. Les valeurs doivent tre saisies entre guillemets simples et spares par une virgule. Veillez ce que les valeurs saisies correspondent la longueur des champs dfinis dans le schma. 7. Renseignez les champs den-tte (Header), de pied de page (Footer) et de limite (Limit) selon la structure de votre fichier d'entre et selon vos besoins. Dans ce scnario, ignorez la premire ligne lors de la lecture du fichier d'entre en saisissant 1 dans le champ Header et laissez les autres champs tels qu'ils sont. 8. Dans la liste Schema, slectionnez Repository si le schma d'entre est stock dans le Repository. Dans ce scnario, slectionnez Built-In pour dfinir les donnes transmettre au composant tFileOutputXML. 9. Vous pouvez slectionner et/ou modifier le schma via la fonction Edit Schema. Pour ce schma, dfinissez trois colonnes, respectivement Contracts, CustomerRef et InsuranceNr correspondant aux trois valeurs de longueurs dfinies. Cliquez sur OK pour fermer la bote de dialogue [Schema] et propager les modifications.

Guide de Rfrence des Composants Talend Open Studio

1173

Scnario : Transformer un fichier positionnel en fichier XML

Configurer les donnes de sortie


1. Double-cliquez sur le composant tFileOutputXML afin d'afficher sa vue Basic settings et configurer ses proprits de base.

2. Saisissez le chemin daccs au fichier XML de sortie. 3. Dfinissez la balise de la ligne (Row tag) qui dfinit chaque ligne. Dans ce cas, la balise est ContractRef. 4. Cliquez sur le bouton [+] ct du champ Edit Schema pour voir la structure de donnes, puis cliquez sur Sync columns pour rcuprer la structure des donnes du composant d'entre. 5. Cliquez sur l'onglet Advanced settings afin de configurer les paramtres avances de la sortie XML.

1174

Guide de Rfrence des Composants Talend Open Studio

Scnario : Transformer un fichier positionnel en fichier XML

6. Cliquez sur le bouton [+] pour ajouter une ligne dans la table Root tags et saisissez un nom de balise (ou plusieurs) pour encadrer la structure XML de sortie, ContractsList dans ce scnario. 7. Configurez les paramtres dans la table Output format si ncessaire. Par exemple, cochez la case As attribute d'une colonne si vous souhaitez utiliser son nom et sa valeur comme attribut pour l'lment XML parent. Dcochez la case Use schema colum name pour que la colonne rutilise le libell de la colonne d'entre comme libell de la balise. Dans ce scnario, laissez les paramtres par dfaut. 8. Pour regrouper les lignes de sortie selon le numro de contrat, cochez la case Use dynamic grouping, ajoutez une ligne dans la table Group by, slectionnez Contract dans la liste Column et saisissez un attribut pour cette colonne dans le champ Attribute label.

9. Laissez les autres paramtres tels qu'ils sont.

Sauvegardez et excuter le Job


1. Appuyez sur les touches Ctrl+S afin de sauvegarder votre Job et vous assurer que tous les paramtres sont bien pris en compte. 2. Appuyez sur F6 ou cliquez sur l'onglet Run puis sur le bouton Run pour excuter le Job. Le fichier est lu ligne par ligne selon les longueurs dfinies prcdemment dans le champ Pattern et crit en tant que fichier XML, comme dfini dans les paramtres de sortie. Vous pouvez louvrir dans nimporte quel diteur XML standard.

Guide de Rfrence des Composants Talend Open Studio

1175

Scnario : Transformer un fichier positionnel en fichier XML

1176

Guide de Rfrence des Composants Talend Open Studio

tFileInputProperties

tFileInputProperties

Proprits du tFileInputProperties
Famille de composant File/Input Fonction Objectif Basic settings Le composant tFileInputProperties lit un fichier texte ligne par ligne et extrait les champs. Il ouvre un fichier texte quil lit ligne par ligne, spare les champs sur le modle cl=valeur. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Pour ce composant, le schma est en lecture seule puisque les fichiers sont structurs sur le modle cl=valeur. Slectionnez le format de votre fichier .properties ou .ini. .properties : fichier de configuration dont les donnes sont disposes sur deux lignes et structures de la manire suivante cl=valeur. .ini : fichier de configuration dont les donnes sont disposes sur deux lignes, structures de la manire suivante cl=valeur.et regroupes en sections. Retrieve Mode : - Retrieve All pour rcuprer lintgralit du fichier, - Retrieve Sections pour rcuprer les sections du fichier, - Retrieve by section pour rcuprer les donnes contenues dans la section spcifie dans le champ Section Name. Section Name : saisissez le nom de la section sur laquelle effectuer lopration ditration. File Chemin daccs et nom du fichier, et/ou variable traiter. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Calculate MD5 Hash Advanced settings Encoding Cochez cette case pour que lalgorithme vrifie que le fichier est bien tlcharg. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

File format

tStatCatcher Statistics Utilisation

Utilisez ce composant pour lire un fichier et sparer les donnes en fonction de la structure cl=valeur du fichier.

Guide de Rfrence des Composants Talend Open Studio

1177

Scnario : Lire et mapper la cl et les valeurs de fichiers properties et alimenter un glossaire

Scnario : Lire et mapper la cl et les valeurs de fichiers properties et alimenter un glossaire


Le scnario suivant est un Job de quatre composants lisant deux fichiers proprits en anglais et en franais. Ces donnes sont ensuite mises en correspondance afin de constituer un glossaire.

Les fichiers de proprits utiliss pour ce scnario sont des fichiers contenant les chanes de caractres utiliss pour la localisation du composant tMysqlInput de Talend Open Studio.

Cliquez-glissez deux composants tFileInputProperties de la famille File > Input dans le Job designer, un composant tMap de la famille Processing et un composant tLogRow de la famille Log & Errors. Reliez les composants entre eux via des connexions Row > Main Le second fichier, FR, est utilis comme flux de rfrence . Double-cliquez sur le premier composant tFileInputProperties pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

1178

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lire et mapper la cl et les valeurs de fichiers properties et alimenter un glossaire

Dans le champ File Format, slectionnez le format de votre fichier. Dans le champ File Name, cliquez sur le bouton [...] et slectionnez le fichier .properties anglais que vous souhaitez utiliser. Rptez cette procdure avec le deuxime composant et le fichier franais :

Double-cliquez sur le composant tMap pour ouvrir son diteur :

Slectionnez toutes les colonnes de la table English_terms et glissez-les vers la table de sortie. Slectionnez la colonne key de la table English_terms et glissez-la dans la colonne key de la table French_terms. Dans le tableau glossary de la zone Schema editor en bas du tMap, renommez le champ value en EN puisquil contiendra les valeurs du fichier anglais. Cliquez sur le bouton [+] pour ajouter une ligne au tableau glossary et renommez-la FR. Dans le champ Length, configurez la taille maximum du champ 255. Dans le coin suprieur gauche de lditeur du tMap, slectionnez la colone value de la table English_terms et glissez-la dans la colonne FR de la table French_terms.

Guide de Rfrence des Composants Talend Open Studio

1179

Scnario : Lire et mapper la cl et les valeurs de fichiers properties et alimenter un glossaire

Cliquez sur OK pour valider vos changements et fermer lditeur. Dans le Job designer, double-cliquez sur le composant tLogRow pour paramtrer ses proprits dans longlet Basic settings de la vue Component. Cliquez sur le bouton Sync Columns pour rcuprer le schma du composant prcdent. Enregitrez votre Job et appuyez sur F6 pour lexcuter.

Le glossaire apparat dans la console de la vue Run avec dans la premire colonne le nom de la cl, dans la deuxime le terme du fichier anglais et dans le troisime colonne le terme correspondant du fichier franais.

1180

Guide de Rfrence des Composants Talend Open Studio

tFileInputRegex

tFileInputRegex

Proprits du tFileInputRegex
Famille de composant Fonction Objectif File/Input Puissant composant qui peut remplacer bon nombre des composants File. Il requiert des connaissances avances en rdaction dexpressions rgulires. Le tFileInputRegex lit un fichier ou un flux de donnes ligne par ligne afin de le diviser en champs laide dexpressions rgulires et denvoyer les champs dfinis dans le schma au composant suivant via une connexion Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File name/Stream File name : Chemin daccs et nom du fichier, et/ou variable traiter. Stream : Flux de donnes traiter. Les donnes doivent pralablement tre mises en flux afin dtre rcupres par le tFileInputRegex via la variable INPUT_STREAM disponible dans la liste dauto-compltion (Ctrl+Espace). Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Row separator Regex Chane (ex : \n sous Unix) pour distinguer les lignes. Ce champ est compatible peut contenir plusieurs lignes. Intgrez vos expressions rgulires le subpattern correspondant aux champs extraire. En Java, doublez les antislashes en regexp Header Footer Limit Nombre de lignes ignorer en dbut de fichier. Nombre de lignes ignorer en fin de fichier. Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ni traite.

Basic settings

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement : leGuide utilisateur de Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

1181

Scnario : Transformer en fichier Regex en Positional

Repository : Le schma existe dj et stock dans le Repository. Ainsi, il est rutilisable dans divers projets et Job designs. Voir galement leGuide utilisateur de Talend Open Studio. Skip empty rows Die on error Cochez cette case pour ignorer les lignes vides. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Advanced settings

Encoding

tStatCatcher Statistics Utilisation

Ce composant sert lire un fichier et en sparer les champs selon les Regex dfinies. Ce composant permet de crer un flux de donnes laide dun lien Row > Main, ainsi que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet du composant tFileInputXML. n/a

Limitation

Scnario : Transformer en fichier Regex en Positional


Le scnario suivant est un Job form de deux composants, qui a pour objectif de lire les donnes dun fichier dentre utilisant des expressions rgulires et transformant les donnes ainsi dlimites en sortie positionnelle.

Cliquez et dposez un composant tFileInputRegex et tFileOutputPositional de la Palette dans lespace de modlisation. Cliquez droit sur le composant tFileInputRegex et slectionnez une connexion Row > Main dans le menu contextuel. Faites glisser cette connexion vers le composant tFileOutputPositional et relchez lorsque le symbole appropri apparat. Slectionnez tFileInputRegex nouveau et dfinissez ses proprits dans longlet Component :

1182

Guide de Rfrence des Composants Talend Open Studio

Scnario : Transformer en fichier Regex en Positional

Les proprits de ce Job sont de type built-in. Par consquent, elles ne sont dfinies que pour ce Job et ne peuvent tre partages avec dautres utilisateurs. Indiquez le chemin daccs au fichier dans le champ File Name. Ce champ est obligatoire. Dfinissez le sparateur de lignes, dans le champ Row separator, afin didentifer la fin dune ligne. Puis, dans Regular expression, dfinissez lexpression rgulire utiliser pour dlimiter les champs dune ligne qui seront passs au composant suivant. Vou pouvez saiisir une expression rgulire multiligne si vous en avez besoin. Assurez-vous dinclure dans cette expression tous les sous-patterns des champs extraire. Dans ce scnario, ignorez les champs en-tte (Header), pied de page (Footer) et limite (Limit). Dans le Schema, slectionnez local (Built-in) comme type de schma des donnes transfrer au composant tFileOutputPositional. Vous pouvez charger ou crer partir de la fonction Edit Schema. Puis dfinissez les proprits du deuxime composant :

Saisissez le chemin daccs au fichier de sortie. Saisissez lencodage du fichier de sortie dans le champ Encoding. Notez que pour linstant, lhomognit de lencodage dans un Job nest pas vrifie.

Guide de Rfrence des Composants Talend Open Studio

1183

Scnario : Transformer en fichier Regex en Positional

Slectionnez le type de schma dans Schema. Cliquez sur le bouton Sync columns pour rcuprer en sortie le schma dentre. Passez longlet Run et cliquez sur le bouton Run pour excuter le Job. Le fichier dentre est lu ligne par ligne puis divis en champs dlimits selon la valeur de lexpression regulire dfinie. Vous pouvez ouvrir le fichier de sortie avec tout diteur standard.

1184

Guide de Rfrence des Composants Talend Open Studio

tFileInputXML

tFileInputXML

Le tFileInputXML appartient deux familles de composants : File et XML. Pour plus dinformations concernant le composant tFileInputXML, consultez la section intitule tFileInputXML .

Guide de Rfrence des Composants Talend Open Studio

1185

tFileList

tFileList

Proprits du tFileList
Famille de composant Fonction Objectif Basic settings File/Management Le composant tFileList fait une boucle sur les fichiers et/ou les dossiers dun rpertoire donn. Le tFileList rcupre un groupe de fichiers et/ou de dossiers suivant un masque donn et fait une boucle sur chacun deux. Directory FileList Type Chemin daccs au rpertoire de fichiers. Slectionnez partir de la liste droulante le type de source dentre utilis : Files pour des fichiers, Directories pour des rpertoires ou Both pour les deux types. Cochez cette case si le ou les rpertoires slectionn(s) contiennent des sous-dossiers. Cochez cette case pour crer un filtre selon la casse des noms des fichiers.

Include subdirectories Case Sensitive

Generate Error if no file Cochez cette case pour tre averti par un message found derreur que la recherche de fichier na pas abouti. Use Glob Expressions as Filemask (Unchecked means Perl5 Regex Expressions) Files Cette case est coche par dfaut et permet de filtrer les rsultats laide dexpressions globales (Glob Expressions). Dcochez la case pour filtrer les rsultats laide dexpressions de type regex Perl5. Cliquez sur le bouton [+] pour ajouter des lignes de filtre : Filemask : entrez un nom de fichier ou masque de fichier utilisant un caractre spcial ou une expression rgulire. Order by Les dossiers sont lists en premier, puis viennent ensuite les fichiers. Vous pouvez dfinir les priorits des dossiers et des fichiers de diffrentes manires : By default : par ordre alphabtique, par dossier puis par fichier, By file name :par ordre alphabtique ou ordre alphabtique invers, By file size : du plus petit lger au plus lourd ou du plus lourd au plus lger, By modified date : du plus rcent au plus ancien ou du plus ancien au plus rcent. Lorsque vous slectionnez loption By file name, si deux fichiers ont le mme nom, le classement seffectuera via loption By modified date. Si vous choisissez loption By file size, et

1186

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileList

que les fichiers font le mme poids, ils seront classs selon loption By file name. Si vous slectionnez loption By modified date et que la date de modification est la mme pour deux fichiers, alors ils seront classs selon loption By file name. Order action Choisissez de classer par ordre : ASC : ordre alphabtique / du plus petit au plus grand / du plus ancien au plus rcent. DESC : linverse de lordre alphabtique / du plus grand au plus petit / du plus ancien au plus rcent. Advanced settings Use Exclude Filemask Cochez cette case pour activer le champ Exclude Filemask afin d'exclure les conditions de filtre bases sur le type de fichier :Exclude Filemask : Renseignez le champ en saisissant les types de fichier devant tre exclus du tableau Files de la vue Basic settings. Les types de fichier dans ce champ doivent tre entours de guillemets doubles et spars par des virgules. Format file path to slash Cochez cette case afin de formater le chemin d'accs au (/) style (useful on Win- fichier en insrant des barres obliques (/), option utile dows) sous Windows. tStatCatcher Statistics Utilisation Global Variables Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Le composant tFileList fournit une liste de fichiers dun rpertoire donn sur lequel il fait une boucle. Current File Name : indique le nom actuel du fichier. Disponible comme variable Flow. Retourne une chane de caractres. Current File Name with Path : indique le nom actuel du fichier et son chemin daccs. Disponible comme variable Flow. Retourne une chane de caractres. Current File Extension : indique lextension actuelle du fichier. Disponible comme variable Flow. Retourne une chane de caractres. Current File Directory : indique le chemin daccs au dossier ou au sous-dossier dans lequel le fichier est stock. Disponible comme variable Flow. Retourne une chane de caractres. Number of files : indique le nombre de fichiers sur lesquels a t effectue une boucle. Disponible comme variable Flow.

Guide de Rfrence des Composants Talend Open Studio

1187

Scnario : Itration sur un rpertoire

Retourne un entier. Pour plus dinformations concernant les variables, consultez leGuide utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Iterate. Trigger : OnSubjobOk, OnSubjobError, OnComponentOk, OnComponentError. Les liens dentre (dun composant un autre) : Row : Iterate. Trigger : Run If, OnSubjobOk, OnSubjobError, Synchronize, Parallelize. Pour plus dinformations concernant les connexions, consultez leGuide utilisateur de Talend Open Studio.

Scnario : Itration sur un rpertoire


Le scnario suivant dcrit un Job de trois composants, qui a pour objectif de rpertorier les fichiers dun rpertoire donn, de lire chaque fichier par itration, de slectionner les donnes dlimites et dafficher ces donnes en sortie dans la console Run.

Cliquez et dposez les composants suivants : tFileList, tFileInputDelimited et tLogRow dans lespace de modlisation. Cliquez-droit sur le composant tFileList et connectez-le au composant tFileInputDelimited via une connexion de type Row Iterate. Puis connectez le tFileInputDelimited au tLogRow laide dune connexion de type Row Main. Paramtrez ensuite les proprits respectives des composants. Tout dabord, slectionnez le composant tFileList et cliquez sur longlet Basic settings :

1188

Guide de Rfrence des Composants Talend Open Studio

Scnario : Itration sur un rpertoire

Dans le champ Directory, indiquez le chemin daccs des fichiers traiter. Pour faire apparatre ce chemin daccs dans le Job lui-mme, utilisez le nom de champ (__DIRECTORY__) qui apparat en bulle info lorsque vous passez le souris sur le champ Directory. Saisissez cette rfrence dans le champ Label Format de longlet View.

Dans le champ FileList Type, slectionnez loption Files. Dfinissez le champ Case sensitive sur Yes pour prendre la casse en compte dans cet exemple. Laissez la case Use Glob Expressions as Filemask coche si vous utilisez des expressions globales pour filtrer les fichiers. Dans le champ Filemask, indiquez un masque de fichier. Utilisez les caractres spciaux si besoin est. Paramtrez les proprits du deuxime composant tFileInputDelimited :

Dans le champ File Name, nommez le fichier laide dune variable contenant son chemin daccs, tel que vous lavez renseign dans les proprits du tFileList. Appuyez sur Ctrl+Espace pour accder la liste dautocompltion des variables. Slectionnez la variable ((String)globalMap.get("tFileList_1_CURRENT_FILEPATH")). globale

Renseignez les autres champs comme pour un fichier dlimit tFileInputDelimited standard. Voir galement : la section intitule Proprits du tMDMInput . Slectionnez le composant de sortie tLogRow et renseignez le sparateur de champs qui saffichera dans la console de longlet Run. Voir galement : la section intitule Proprits du tLogRow .

Guide de Rfrence des Composants Talend Open Studio

1189

Scnario : Itration sur un rpertoire

Litration seffectue sur le rpertoire dfini. Chacun des fichiers contenus dans ce rpertoire est lu. Puis les donnes dlimites sont transmises au composant de sortie qui les affiche dans la console Log de la vue Run. Pour dautres scnarios utilisant le tFileList, consultez la section intitule tFileCopy

1190

Guide de Rfrence des Composants Talend Open Studio

tFileOutputARFF

tFileOutputARFF

Proprits du tFileOutputARFF
Famille de composant Fonction Objectif Basic settings File/Output Le composant tFileOutputARFF transmet des donnes vers un fichier ARFF. Ce composant crit un fichier ARFF contenant des donnes organises en fonction du schma dfini. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant connexion de base de donnes et enregistrer les paramtres de connexion que vous avez dfinis dans la vue Basic settings du composant. Pour plus dinformations sur comment dfinir et stocker des paramtres de connexion de base de donnes, consultez le Guide utilisateur de Talend Open Studio . File name Chemin daccs et nom du fichier de sortie, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Attribute Define Reflte le schma tel quil est dfini dans la bote de dialogue Edit schema. Column : Nom de la colonne. Type : Type des donnes de la colonne. Pattern : Saisissez le modle (pattern) de la donne si ncessaire. Relation Append Saisissez le nom de la relation. Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

1191

Scnario associ

Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Advanced settings Dont generate empty Cochez cette case pour empcher la gnration dun fifile chier vide. tStatCatcher Statistics Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation Global Variables

Utilisez ce composant pour crire dans un fichier ARFF des donnes rcupres dautres composants laide dune connexion de type Row. Les variables globales peuvent tre utilises comme paramtres dans la plupart des champs de proprits descurseur dans le champ puis appuyez sur Ctrl+Espace. Double-cliquez sur la variable afin de populer le champ. La principale variable globale associe au tFileOutputARFF est : Number of Lines : indique le nombre de lignes traites. Disponible comme variable After.

Connections

Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide utilisateur Talend Open Studio.

Limitation

n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Afficher le contenu dun fichier ARFF .

1192

Guide de Rfrence des Composants Talend Open Studio

tFileOutputDelimited

tFileOutputDelimited

Proprits du tFileOutputDelimited
Famille de composant Fonction Objectif Basic settings File/Output Le composant tFileOutputDelimited transmet des donnes vers un fichier dlimit. Ce composant crit un fichier dlimit contenant des donnes organises en fonction du schma dfini. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use Output Stream Cochez la case pour traiter le flux de donnes qui vous intresse. Une fois coche, le champ Output Stream saffiche et vous pouvez saisir le flux de donnes souhait. Le flux de donnes traiter doit tre ajout au flux afin que ce composant rcupre ces donnes via la variable reprsentative correspondante. Cette variable peut tre prdfinie dans votre Studio ou fournie par le contexte ou les composants utilis(s) avec ce composant. Sinon, vous pouvez la dfinir manuellement et lutiliser selon votre Job, par exemple laide dun tJava ou dun tJavaFlex. Afin dviter les dsagrments de la saisie, vous pouvez slectionner la variable qui vous intresse dans la liste dautocompltion (Ctrl+Espace) afin de remplir le champ, si cette variable a t correctement dfinie. Pour plus dinformations concernant lutilisation dun flux, consultez la section intitule Scnario 2 : Lire les donnes dun fichier distant en mode stream . File name Chemin daccs et nom du fichier de sortie et/ou variable utiliser. Ce champ est indisponible lorsque vous avez coch la case Use Output Stream. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Row Separator Field Separator Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire pour sparer les champs du fichier de sortie.

Guide de Rfrence des Composants Talend Open Studio

1193

Proprits du tFileOutputDelimited

Append Include Header Compress as zip file

Cochez cette option pour ajouter de nouvelles lignes la fin du fichier. Cochez cette case pour tenir compte de len-tte dans le fichier de sortie. Cochez cette case pour compresser en zip le fichier de sortie.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository.. Si vous effectuez des modifications, le schma passe automatiquement en mode Built-In. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement leGuide utilisateur de Talend Open Studio. Sync columns Cliquez sur ce bouton pour synchroniser le schma de sortie avec celui dentre. La fonction Sync ne saffiche que si une connexion de type Row est lie au composant de sortie.

Advanced settings

Advanced separator Cochez cette option pour modifier les sparateurs utili(for numbers) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. CSV options Cochez cette case pour prendre en compte les paramtres spcifiques aux fichiers CSV, notamment la manire de protger les caractres dans le champ Escape char et le type de guillemet dans le champ Enclosure.

Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Split output in several Si le fichier dlimit en sortie est volumineux, vous files pouvez le scinder en plusieurs fichiers. Rows in each output file : saisissez le nombre de lignes pour chaque fichier de sortie. Custom the flush buffer Cochez cette case pour personnaliser le nombre de size lignes crire avant de vider le tampon. Row Number : Nombre de lignes crire avant de vider le tampon. Output in row mode Encoding Cochez cette case pour que lcriture se fasse en mode ligne. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ

1194

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes dans un fichier dlimit

est obligatoire pour la manipulation des donnes de base de donnes. Dont generate empty Cochez cette case pour empcher la gnration dun fifile chier vide. tStatCatcher Statistics Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation

Utilisez ce composant pour crire dans un fichier dlimit des donnes rcupres dautres composants laide dune connexion de type Row et sparer les champs laide dun sparateur. n/a

Limitation

Scnario : Ecrire des donnes dans un fichier dlimit


Ce scnario est constitu de trois composants et a pour objectif dextraire certaines donnes dun fichier contenant des informations sur les clients (customers) puis de les crire dans un fichier dlimit en sortie. Dans lexemple suivant, vous avez enregistr les informations de connexion et les mtadonnes dans le Repository afin de faciliter leur rutilisation. Pour plus dinformations sur comment centraliser les donnes de connexion et autres mtadonnes dun fichier dans le Repository, consultez le Guide Utilisateur Talend Integration Suite Studio.

Dans le Repository, ouvrez le nud File Delimited de la catgorie Metadata. Cliquez sur la mtadonne customers, et dposez-le dans lespace de modlisation graphique. Une bote de dialogue souvre et vous demande quel type de composant vous voulez dposer.

Guide de Rfrence des Composants Talend Open Studio

1195

Scnario : Ecrire des donnes dans un fichier dlimit

Cliquez sur tFileInputDelimited puis sur OK Un composant tFileInputDelimited contenant le nom de votre schma dentre saffiche dans lespace de modlisation graphique. Dposez un composant tMap et un composant tFileOutputDelimited de la Palette dans lespace de modlisation graphique. Reliez les composants laide dun lien Row > Main. Double-cliquez sur le composant afin dafficher la vue Component, afin de paramtrer les informations de connexion et dfinir le schma des donnes d'entre.

Si vous slectionnez Repository dans la liste Property Type, les champs suivants seront automatiquement renseigns partir des informations centralises dans le Repository. Si vous slectionnez le mode Built-In, renseignez les champs manuellement. Cliquez sur le bouton [...] correspondant au champ File Name. Dans la bote de dialogue de slection, parcourez le systme de fichiers et slectionnez le fichier dentre, dans cet exemple: customer.csv. Si le chemin daccs du fichier contient des caractres accentus, vous obtiendrez un message derreur lors de lexcution du Job. Pour plus dinformations concernant la procdure suivre lorsque les accents ne sont pas supports, consultez le Guide dinstallation Talend Open Studio . Dans les champs Row et Field Separators, saisissez respectivement le sparateur de lignes "\n" et le sparateur de champs ";". Si votre fichier contient des en-ttes ou des pieds-de-page, indiquez le nombre de lignes concernes dans les champs Header et Footer. Dans cet exemple, saisissez 6 dans le champ Header. Vous pouvez galement dfinir une limite au nombre de lignes traites, en saisissant un nombre dans le champ Limit. Si vous avez slectionn le mode Repository, le schma du fichier sera automatiquement renseign. En mode Built-in, cliquez sur Edit Schema afin de dcrire les donnes dentre, et ainsi dfinir le schma trait. Le schma du fichier Customers se prsente comme suit :

1196

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes dans un fichier dlimit

Cliquez sur OK pour fermer la bote de dialogue. Double-cliquez sur le tMap afin douvrir son diteur.

Dans cet diteur, cliquez sur le bouton plus vert a new output table]. en haut droite pour ouvrir la bote de dialogue [Add

Saisissez un nom pour la table que vous souhaitez crer, row2 dans cet exemple.

Guide de Rfrence des Composants Talend Open Studio

1197

Scnario : Ecrire des donnes dans un fichier dlimit

Cliquez sur OK pour valider vos modifications et fermer la bote de dialogue. Dans la table de gauche (row1), slectionnez les trois premires lignes (Id, CustomerName et CustomerAddress) en appuyant sur Ctrl, puis glissez-les dans la table de droite. Dans le Schema editor en bas de lditeur, changez le Type de la ligne RegisterTime, dans la table de droite, et passez-le en chane de caractres, String.

Cliquez sur OK pour enregistrer les modifications et fermer lditeur. Dans lespace de modlisation, double-cliquez sur le composant tFileOutputDelimited pour ouvrir la vue Component et dfinir ses proprits.

Dans le champ Property Type, slectionnez le mode Built-in et renseignez les champs suivants manuellement. Cliquez sur le bouton [...] correspondant au champ File Name. Dans la bote de dialogue de slection, indiquez le rpertoire de destination et le nom de votre fichier. Pour les champs Row et Field Separators, saisissez respectivement le sparateur de lignes \n et le sparateur de champs ;. Ils seront utiliss dans le fichier de sortie pour dlimiter les valeurs et les lignes. Cochez la case Include Header si vous souhaitez rcuprer le libell des colonnes. Cliquez sur Edit schema et assurez-vous que le schma est correctement rcupr du schma dentre. Si ncessaire, cliquez sur Sync Columns pour rcuprer le schma du composant prcdent. Pour excuter le Job, appuyez sur F6.

1198

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser un flux de sortie pour sauvegarder des donnes dans un fichier local

Le fichier cr est dlimit par des points-virgules, il ne contient que les colonnes Id, CustomerName et CustomerAddress.

Scnario : Utiliser un flux de sortie pour sauvegarder des donnes dans un fichier local
Bas sur le scnario prcdent, ce scnario sauvegarde les donnes filtres dans un fichier local, l'aide de l'option Output Stream.

1. Dposez un composant tJava de la Palette dans l'espace de modlisation graphique. 2. Connectez le tJava au tFileInputDelimited l'aide d'un lien Trigger > On Subjob OK. 3. Double-cliquez sur le tJava pour ouvrir sa vue Basic settings et configurer ses proprits.

4. Dans la zone Code, saisissez la commande suivante : new java.io.File("C:/myFolder").mkdirs();

Guide de Rfrence des Composants Talend Open Studio

1199

Scnario : Utiliser un flux de sortie pour sauvegarder des donnes dans un fichier local

globalMap.put("out_file",new der/customerselection.txt",false));

java.io.FileOutputStream("C:/myFol-

Dans ce scnario, la commande utilise dans la zone Code du tJava va crer un nouveau dossier C:/ myFolder dans lequel le fichier de sortie customerselection.txt sera sauvegard. Vous pouvez personnaliser la commande selon vos besoins. 5. Double-cliquez sur le tFileOutputDelimited afin d'ouvrir sa vue Basic settings et configurer ses proprits.

6. Cochez la case Use Output Stream pour activer le champ Output Stream, dans lequel vous pouvez dfinir le flux de sortie, l'aide d'une commande. Renseignez le champ Output Stream en saisissant la commande suivante : (java.io.OutputStream)globalMap.get("out_file") Vous pouvez personnaliser la commande dans le champ Output Stream en appuyant sur les touches Ctrl+Espace pour utiliser l'auto-compltion ou saisissez votre commande manuellement dans le champ. Dans ce scnario, la commande utilise dans le champ Output Stream appelle la classe java.io.OutputStream pour crire le flux de donnes filtres dans un fichier local, dfini dans la zone Code du composant tJava. 7. Cliquez sur Sync columns afin de rcuprer le schma du composant prcdent. 8. Laissez les autres composants tels qu'ils sont. 9. Sauvegardez votre Job et appuyez sur F6 pour l'excuter. Les trois colonnes spcifies, Id, CustomerName et CustomerAddress sont crites dans le fichier de sortie dfini.

1200

Guide de Rfrence des Composants Talend Open Studio

tFileOutputEBCDIC

tFileOutputEBCDIC

Ce composant requiert lutilisation dun JDK Sun.

Proprits du tFileOutputEBCDIC
Famille de composant File/Output Fonction Objectif Basic settings Le composant tFileOutputEBCDIC crit un fichier EBCDIC partir de plusieurs fichiers de donnes diffrents ayant chacun un schma diffrent. Ce composant crit un fichier EBCDIC avec des donnes extraites de fichier(s) en fonction des schmas dcrivant leur structure. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. File Name Chemin daccs et nom du fichier EBCDIC de sortie, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Xc2j file Advanced settings tStatCatcher Statistics Slectionnez le fichier xc2j de transformation. Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation

Utilisez ce composant pour crire un fichier EBCDIC et sparer les donnes en fonction des schmas identifis dans les fichiers en entre.

Scnario : Crer un fichier EBCDIC partir de deux fichiers dlimits


Ce scnario utilise lassistant [Copybook Connection] guidant lutilisateur travers les diffrentes tapes de cration de connexion au fichier Copybook et de rcupration des schmas EBCDIC. Lassistant [Copybook Connection] est uniquement disponible pour les utilisateurs Talend Enterprise. Si vous tes utilisateur de Talend Open Studio, vous devez configurer les proprits du composant tFileOutputEBCDIC manuellement. Le scnario suivant est un Job de trois composants ayant pour objectif dcrire un fichier au format EBCDIC partir de deux fichiers dlimits ayant des schmas diffrents.

Guide de Rfrence des Composants Talend Open Studio

1201

Scnario : Crer un fichier EBCDIC partir de deux fichiers dlimits

Ce scnario Java utilise lassistant EBCDIC Connection pour crer une connexion au fichier Copybook et gnrer un fichier xc2j permettant de rcuprer et de transformer les diffrents schmas du fichier. Crez une connexion au fichier Copybook dcrivant la structure dun fichier EBCDIC. Dans ce scnario la connexion Copybook est appele EBCDIC. Rcuprez le schma du fichier. Une fois la connexion au fichier Copybook cre et les schmas rcuprs laide des assistants EBCDIC et Schema, ils apparaissent sous le nud Metadata > Copybook. Ces nouveaux schmas sappellent Schema01, Schema04 et Schema05. Pour crer un fichier EBCDIC partir de deux fichiers dlimits dans Talend Open Studio : Cliquez et dposez deux composants tFileInputDelimited et un composant tFileOutputEBCDIC dans lditeur graphique. Pour les relier, cliquez-droit sur chaque composant tFileInputDelimited, slectionnez Row > Main dans le menu contextuel et cliquez sur le composant tFileOutputEBCDIC. Double-cliquez sur le premier tFileInputDelimited pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Dans le champ File Name, slectionnez le fichier dlimit en cliquant sur le bouton [...]. Si le chemin daccs du fichier contient des caractres accentus, vous obtiendrez un message derreur lors de lexcution du Job. Pour plus dinformations concernant la procdure suivre lorsque les accents ne sont pas supports, consultez le Guide dinstallation Talend Open Studio . Dans le champ Schema, slectionnez loption Repository, puis cliquez sur le bouton [...] et slectionnez le schma correspondant votre fichier dans la bote de dialogue, sous le nud Copybook.

1202

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un fichier EBCDIC partir de deux fichiers dlimits

Dans le champ Header, indiquez le nombre de ligne en-tte rcuprer et passer au composant suivant : 1 dans ce scnario. Paramtrez les proprits du deuxime tFileInputDelimited de la mme manire que le premier. Double-cliquez sur le tFileOutputEBCDIC pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits :

Dans le champ Data file, indiquez le rpertoire et le nom du fichier EBCDIC qui sera cr partir des deux fichiers dlimits. Dans le champ Xc2j file, renseignez le chemin daccs au fichier permettant dextraire le schma dcrivant la structure du fichier EBCDIC. Enregistrez votre Job via Ctrl+S et cliquez sur la vue Run, cochez les cases Statistics et Exec time puis cliquez sur Run pour excuter le Job

Guide de Rfrence des Composants Talend Open Studio

1203

tFileOutputExcel

tFileOutputExcel

Proprits du tFileOutputExcel
Famille de composant Fonction Objectif Basic settings File/Output Le composant tFileOutputExcel transmet des donnes vers un fichier de type MS Excel. Ce composant crit un fichier MS Excel contenant des donnes organises en fonction du schma dfini. Write excel 2007 file Cochez cette case pour crire les donnes traites au format (xlsx) format Excel 2007, .xlsx. Use Output Stream Cochez la case pour traiter le flux de donnes qui vous intresse. Une fois coche, le champ Output Stream saffiche et vous pouvez saisir le flux de donnes souhait. Le flux de donnes traiter doit tre ajout au flux afin que ce composant rcupre ces donnes via la variable reprsentative correspondante. Cette variable peut tre prdfinie dans votre Studio ou fournie par le contexte ou les composants utilis(s) avec ce composant. Sinon, vous pouvez la dfinir manuellement et lutiliser selon votre Job, par exemple laide dun tJava ou dun tJavaFlex. Afin dviter les dsagrments de la saisie, vous pouvez slectionner la variable qui vous intresse dans la liste dautocompltion (Ctrl+Espace) afin de remplir le champ, si cette variable a t correctement dfinie. Pour plus dinformations concernant lutilisation dun flux, consultez la section intitule Scnario 2 : Lire les donnes dun fichier distant en mode stream . File name Chemin daccs et nom du fichier de sortie. Ce champ est indisponible lorsque vous avez coch la case Use Output Stream. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Sheet name Include header Append existing file Nom de la feuille. Cochez cette case pour tenir compte de len-tte dans le fichier de sortie. Cochez cette option pour ajouter de nouvelles lignes la fin du fichier.

1204

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileOutputExcel

Append existing sheet : Cochez cette option pour ajouter de nouvelles lignes la fin de la feuille Excel. Is absolute Y pos. Cochez cette case pour rajouter des informations dans des cellules prexistantes : First cell X : emplacement de la cellule sur laxe des abscisses. First cell Y : emplacement de la cellule sur laxe des ordonnes. Keep existing cell format : lorsque la case est coche, cette option permet de garder le format et lalignement de la cellule. Font Slectionnez dans la liste droulante la police utiliser. Define all columns auto Cette case est dcoche par dfaut, vous pouvez alors size prciser dans le tableau associ quelles sont les colonnes dfinir automatiquement. Cochez cette case pour que la taille de toutes les colonnes soit dfinies automatiquement. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement leGuide utilisateur de Talend Open Studio. Sync columns Cliquez sur ce bouton pour synchroniser le schma de sortie avec celui dentre. La fonction Sync ne saffiche que si une connexion de type Row est lie au composant de sortie.

Advanced settings

Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Advanced separator Cochez cette option pour modifier les sparateurs utili(for numbers) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics

Guide de Rfrence des Composants Talend Open Studio

1205

Scnario associ

Utilisation Limitation

Utilisez ce composant pour crire dans un fichier MS Excel des donnes rcupres dautres composants laide dune connexion de type Row. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario: Extraire les donnes dun compte partir de SugarCRM . Pour un scnario relatif l'utilisation de l'option Use Output Stream, consultez la section intitule Scnario : Utiliser un flux de sortie pour sauvegarder des donnes dans un fichier local .

1206

Guide de Rfrence des Composants Talend Open Studio

tFileOutputJSON

tFileOutputJSON

Propits du tFileOutputJSON
Famille de composant Fonction Objectif Basic settings File Le composant tFileOutputJSON crit des donnes dans un fichier structur JSON de sortie. Ce composant reoit des donnes et les rcrit dans un bloc de donnes structures JSON, dans un ficher de sortie. File Name Name of data blocks Nom du fichier de sortie et son chemin daccs. Saisissez, entre guillemets doubles, un nom pour le bloc de donnes crire.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement leGuide utilisateur de Talend Open Studio. Sync columns Cliquez pour synchroniser le schma du fichier de sortie et le schma du fichier dentre. La fonction Sync ne saffiche que lorsquun lien Row connecte le composant de sortie.

Advanced settings

Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Utilisation Limitation

Utilisez ce composant pour rcrire des donnes reues dans un fichier de sortie structur JSON. n/a

Scnario : Ecrire un fichier JSON structur


Ce scnario de deux composants comprend un composant tRowGenerator qui gnre des donnes au hasard, ainsi quun composant tFileOutputJSON qui crit dans un fichier structur JSON de sortie.

Guide de Rfrence des Composants Talend Open Studio

1207

Scnario : Ecrire un fichier JSON structur

Glissez de la Palette dans lespace de modlisation graphique un tRowGenerator et un tFileOutputJSON. Liez les composants laide dun lien Row > Main. Double-cliquez sur le tRowGenerator pour dfinir ses Basic Settings dans la vue Component.

Si le schma dont vous avez besoin est dj stock sous le nud Db Connections dans le nud Repository, slectionnez Repository dans le champ Schema et choisissez les mtadonnes dans la liste. Sinon, cliquez sur [...] ct du bouton Edit Schema afin dafficher la bote de dialogue et dfinir son schma.

Cliquez sur le bouton [+] pour ajouter les colonnes dsires. Sous le nud Columns, saisissez le nom des colonnes. Sous Type, slectionnez le type dans la liste. Cliquez sur OK pour fermer la bote de dialogue. Cliquez sur le bouton [+] ct de RowGenerator Editor pour ouvrir la bote de dialogue correspondante.

1208

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire un fichier JSON structur

Sous Functions, slectionnez les fonctions pr-dfinies pour les colonnes, si besoin, ou slectionnez [...] pour dfinir les paramtres personnaliss des fonctions, dans longlet Function parameters. Saisissez le nombre de lignes gnrer, dans le champ Number of Rows for RowGenerator. Cliquez sur OK pour fermer la bote de dialogue. Cliquez sur le composant tFileOutputJSON afin de dfinir ses proprits, dans longlet Basic Settings de la vue Component.

Cliquez sur le bouton [...] pour parcourir votre rpertoire et dfinir o vous souhaitez gnrer le fichier de sortie JSON, puis saisissez un nom de fichier. Saisissez un nom pour le bloc de donnes gnrer dans le champ correspondant, entre guillemets doubles. Slectionnez Built-In dans la liste Schema. Cliquez sur Sync Columns afin de retrouver le schma du prcdent composant. Appuyez sur F6 pour excuter le Job.

Guide de Rfrence des Composants Talend Open Studio

1209

Scnario : Ecrire un fichier JSON structur

Les donnes du schma dentre sont crites dans un bloc de donnes structures JSON, dans le fichier de sortie.

1210

Guide de Rfrence des Composants Talend Open Studio

tFileOutputLDIF

tFileOutputLDIF

Proprits du tFileOutputLDIF
Famille de composant Fonction Objectif File/Output Le composant tFileOutputLDIF extrait des donnes vers un fichier LDIF qui peut ensuite tre charg dans un annuaire LDAP. Le tFileOutputLDIF crit ou modifie un fichier LDIF avec des donnes dlimites en entre selon le schma dfini. Peut galement supprimer le contenu dun fichier LDIF. File name Chemin daccs et nom du fichier de sortie, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Wrap Change type Place un retour chariot aprs le nombre de caractres dfini. Slectionnez Add, Modify ou Delete pour respectivement crer un nouveau fichier LDIF, modifier ou supprimer un fichier LDIF. En cas de modification, paramtrez le type de modification apporte.

Basic settings

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement leGuide utilisateur de Talend Open Studio. Sync columns Cliquez pour synchroniser le schma du fichier de sortie avec le schma du fichier dentre. La fonction Sync napparat quune fois la connexion Row mise en place entre les composants dentre et de sortie. Cochez cette option pour ajouter des nouvelles lignes la fin du fichier.

Append Advanced settings

Create directory if not Cochez cette case pour crer un nouveau dossier si votre exists dossier de destination nexiste pas. Custom the flush buffer Cochez cette case pour personnaliser le nombre de size lignes crire avant de vider le tampon. Row Number: Nombre de lignes crire avant de vider le tampon.

Guide de Rfrence des Composants Talend Open Studio

1211

Scnario : Ecrire des donnes dans un fichier LDIF

Encoding

Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes.

Dont generate empty Cochez cette case pour empcher la gnration dun fifile chier vide. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Utilisez ce composant pour crire un fichier LDIF laide des donnes provenant dautres composants relis par une connexion de type Row. n/a

Scnario : Ecrire des donnes dans un fichier LDIF


Ce scnario est constitu de deux composants et a pour objectif dextraire les donnes dune table de base de donnes puis dcrire ses donnes dans un fichier LDIF de sortie.

Cliquez et dposez les composants tMysqlInput et tFileOutputLDIF de la Palette dans lespace de modlisation. Connectez les deux composants laide dun lien Row > Main. Slectionnez le composant tMysqlInput et cliquez sur longlet Basic settings de la vue Component. Si vous conservez les informations de connexion votre base de donnes dans la zone Metadata du Repository, slectionnez loption Repository dans le champ Property type . De mme, dans le champ Schema type, slectionnez le schma correspondant parmi les mtadonnes si votre schma est galement stock dans le Repository. Tous les paramtres de connexion comme de schma sont ainsi rcuprs.

Sinon, slectionnez Built-in dans les champs Property type et Schema et paramtrez manuellement votre connexion la base de donnes et les informations du schma. Puis double-cliquez sur le composant tFileOutpuLDIF et paramtrez ses proprits dans longlet Basic settings. Renseignez le nom et le chemin daccs au fichier LDIF. Sil nexiste pas, le Job se chargera de le crer.

1212

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes dans un fichier LDIF

Dans le champ Wrap, saisissez le nombre de caractres contenus sur une ligne. Les caractres qui suivent seront automatiquement placs sur la ligne suivante.

Slectionnez Add dans le champ Change Type puisque, par dfinition, un fichier nouvellement cr est vide. Dans le cas dune modification, vous devrez dfinir la nature de la modification que vous souhaitez effectuer dans le fichier. Dans le champ Schema, slectionnez loption Built-in et cliquez sur Sync Columns pour rcuprer la dfinition du schma dentre. Appuyez sur F6 pour excuter le Job.

Le fichier LDIF cr comporte les donnes de la table de la base de donnes et le type de changement effectu sur le fichier est, dans ce cas, dfini comme : addition.

Guide de Rfrence des Composants Talend Open Studio

1213

tFileOutputMSDelimited

tFileOutputMSDelimited

Proprits du tFileOutputMSDelimited
Famille du composant Fonction Objectif File/Output Le composant tFileOutputMSDelimited permet dcrire des schmas multiples dans un fichier dlimit. Le tFileOutputMSDelimited cre un fichier dlimit multi structure complexe laide de la structure des donnes (schmas) venant des diffrents flux dentre de type Row. File Name Chemin daccs et nom du fichier de sortie, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Row Separator Field Separator Chane (ex : \n sous Unix) sparant les lignes. Caractre, chane ou expression rgulire sparant les champs.

Basic settings

Use Multi Field Separators Cochez cette case attribuer un sparateur diffrent chacun des schmas, partir de la colonne Field separator du champ Schemas. Schemas La table est automatiquement charge avec des schmas rsultant des diffrents flux dentre connects au composant tFileOutputMSDelimited. Renseignez les relations de dpendance entre les diffrents schmas : Parent row : Saisissez le nom du flux pre (en fonction du nom du lien Row qui transfre les donnes). Parent key column : Saisissez le nom de la colonne cl du flux pre. Key column : Saisissez le nom de la colonne cl pour la ligne slectionne. Advanced settings Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss numbers) pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. CSV options Cochez cette case pour prendre en compte les paramtres spcifiques aux fichiers CSV, notamment la manire de protger les caractres dans le champ Escape char et le type de guillemet dans le champ Text enclosure.

1214

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier dlimit de sortie sil nexiste pas dj. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour annuler la gnration du fichier si celui-ci est vide. Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Dont generate empty file tStatCatcher Statistics

Utilisation

Utilisez ce composant pour crire un fichier dlimit multi structure et sparer les champs laide dun sparateur de champ.

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

1215

tFileOutputMSPositional

tFileOutputMSPositional

Proprits du tFileOutputMSPositional
Famille du composant Fonction Objectif Basic settings File/Output Le composant tFileOutputMSPositional permet dcrire des schmas multiples dans un fichier positionnel. Le tFileOutputMSPositional cre un fichier multi structure complexe laide de la structure des donnes (schmas) venant des diffrents flux dentre de type Row. File Name Chemin daccs et nom du fichier crer, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Row separator Schemas Chane (ex : \n sous Unix) sparant les lignes. La table est automatiquement charge avec des schmas rsultant des diffrents flux dentre connects au composant tFileOutputMSPositional. Renseignez les relations de dpendance entre les diffrents schmas : Parent row : Saisissez le nom du flux pre (en fonction du nom du lien Row qui transfre les donnes). Parent key column : Saisissez le nom de la colonne cl du flux pre. Key column : Saisissez le nom de la colonne cl pour la ligne slectionne. Pattern : Saisissez le modle (pattern) qui permet de positionner les sparateurs de champ pour chaque ligne dentre. Padding char : Saisissez entre guillemets le caractre de remplissage utiliser. Le caractre par dfaut est un espace. Alignment : Slectionnez le paramtre dalignement appropri. Advanced settings Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss numbers) pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux.

1216

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier dlimit de sortie sil nexiste pas dj. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

tStatCatcher Statistics

Utilisation

Utilisez ce composant pour crire un fichier positionnel multi structure et sparer les champs laide dun sparateur de position.

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

1217

tFileOutputMSXML

tFileOutputMSXML

Proprits du tFileOutputMSXML
Famille de composant Fonction Objectif File/Output Le composant tFileOutputMSXML permet dcrire des schmas multiples dans un fichier XML structur. tFileOutputMSXML cre un fichier XML multi structure complexe laide de la structure des donnes (schmas) venant des diffrents flux dentre de type Row. File Name Chemin daccs et nom du fichier crer, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Configure XML tree Ouvre linterface ddie pour vous aider mettre en place le mapping XML. Pour plus de dtails sur linterface, voir la section intitule Dfinir un arbre XML Multischma .

Basic settings

Advanced settings

Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier dlimit de sortie sil nexiste pas dj. Advanced separator Cochez cette option pour modifier les sparateurs utili(for numbers) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

Dont generate empty Cochez cette case pour annuler la gnration du fichier file si celui-ci est vide. tStatCatcher Statistics Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Limitation

n/a

1218

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileOutputMSXML

Dfinir un arbre XML Multischma


Double-cliquez sur le composant tFileOutputMSXML pour ouvrir linterface ddie ou cliquez sur le bouton [...] de longlet Basic settings de la vue Component.

La liste droulante de la zone Linker source, gauche de linterface, contient tous les schmas dentre qui peuvent tre ajouts au fichier XML multischma de sortie ( la condition que plusieurs flux dentre soient connects au composant tFileOutputMSXML). Dans le champ Schema List, on retrouve la liste de toutes les colonnes rcupres du flux dentre de la slection. Sur la droite de linterface, dfinissez la structure XML que vous souhaitez obtenir dans le fichier XML en sortie. Vous pouvez la crer manuellement ou tout simplement importer la structure XML. Puis importez les colonnes de chaque schma dentre de la slection dans llment de larbre XML correspondant.

Importer un arbre XML


Le meilleur moyen de renseigner larbre XML est dimporter un fichier XML bien form. Dans la colonne XML Tree, cliquez une fois sur le champ root tag, qui saffiche par dfaut, pour le renommer. Cliquez droit sur ce champ pour afficher le menu contextuel. Dans le menu, slectionnez Import XML tree. Slectionnez le fichier importer et cliquez sur OK.

Guide de Rfrence des Composants Talend Open Studio

1219

Proprits du tFileOutputMSXML

La colonne XML Tree est donc automatiquement renseigne avec les bons lments. Vous pouvez supprimer et ajouter des lments ou des sous lments larbre : Slectionnez llment adquat dans larbre. Cliquez-droit pour faire apparatre le menu contextuel. Slectionnez Delete pour supprimer la slection de larbre ou slectionnez loption adquate parmi les suivantes : Add sub-element, Add attribute, Add namespace pour enrichir larbre.

Crer manuellement larbre XML


Si vous ne possdez pas de structure XML dj dfinie, vous pouvez la crer manuellement. Dans la colonne XML Tree, cliquez une fois sur le champ root tag, qui saffiche par dfaut, pour le renommer. Cliquez-droit sur ce champ pour afficher le menu contextuel. Dans le menu, slectionnez Add sub-element pour crer le premier lment de la structure. Vous pouvez aussi ajouter un attribut ou un lment enfant nimporte quel lment de larbre ou supprimer nimporte quel lment de larbre. Slectionnez llment adquat dans larbre que vous venez de crer. Cliquez-droit gauche du nom de llment pour afficher le menu contextuel. Dans le menu, slectionnez loption adquate parmi les suivantes : Add sub-element, Add attribute, Add namespace ou Delete.

Mapping de donnes XML partir de sources multischma


Une fois votre arbre XML cr, slectionnez le premier schma mapper. Vous pouvez alimenter chaque lment ou sous-lment XML avec les colonnes du flux dentre dans la colonne Related Column :

1220

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileOutputMSXML

Cliquez sur lune des entres de la colonne Schema column name. Glissez-la dans le sous-lment correspondant droite. Relchez-la pour que le mapping soit effectif.

Une flche bleue apparat pour illustrer ce mapping. Sil est disponible, utilisez le bouton Auto-Map situ en bas gauche de linterface, il permet deffectuer cette opration automatiquement. Vous pouvez dconnecter nimporte quel mapping de nimporte quel lment de larbre XML : Slectionnez llment de larbre XML que vous souhaitez dconnecter de sa source respective. Cliquez-droit gauche de son nom pour afficher le menu contextuel. Slectionnez Disconnect linker. La flche bleue disparat.

Dfinir le statut du noeud


Dfinir larbre XML et le transfert de donnes ne suffit pas. Vous devez aussi dfinir les lments sur lesquels la boucle est effectue pour chacune des sources de la slection et, si ncessaire, llment partir duquel le regroupement est effectu.

Elment Boucle
Llment Boucle permet de dfinir llment objet dune itration. Llment Boucle est gnralement un gnrateur de lignes. Pour dfinir un lment comme un lment Boucle : Slectionnez llment adquat dans larbre XML. Cliquez-droit gauche du nom de llment pour afficher le menu contextuel. Slectionnez loption Set as Loop Element.

Guide de Rfrence des Composants Talend Open Studio

1221

Proprits du tFileOutputMSXML

La colonne Node Status affiche le nouveau statut slectionn. Il ne peut y avoir quun seul lment Boucle la fois.

Elment Group
Llment Group est optionnel, il reprsente un lment constant sur lequel est effectue une fonction Groupby. Llment Group ne peut tre dfini que si un lment Boucle a t pralablement dfini. Lorsque vous utilisez un lment Group, les lignes doivent tre tries pour pouvoir tre regroupes par le noeud slectionn. Pour dfinir un lment comme lment Group : Slectionnnez llment adquat dans larbre XML. Cliquez-droit gauche du nom de llment pour afficher le menu contextuel. Slectionnez loption Set as Group Element.

1222

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

La colonne Node Status affiche le nouveau statut slectionn et tout autre statut de regroupement est automatiquement dfini, si ncessaire. Une fois le mapping termin, cliquez sur OK pour valider les paramtres et continuez la configuration de votre Job.

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

1223

tFileOutputPositional

tFileOutputPositional

Proprits du tFileOutputPositional
Famille de composant Fonction Objectif Basic settings File/Output Le composant tFileOutputPositional crit un fichier ligne par ligne en se basant sur la longueur et le format des champ ou colonnes dune ligne. Il crit un fichier ligne par ligne, en se basant sur la structure des donnes (schma) venant du flux dentre. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier o sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use Output Stream Cochez la case pour traiter le flux de donnes qui vous intresse. Une fois coche, le champ Output Stream saffiche et vous pouvez saisir le flux de donnes souhait. Le flux de donnes traiter doit tre ajout au flux afin que ce composant rcupre ces donnes via la variable reprsentative correspondante. Cette variable peut tre prdfinie dans votre Studio ou fournie par le contexte ou les composants utilis(s) avec ce composant. Sinon, vous pouvez la dfinir manuellement et lutiliser selon votre Job, par exemple laide dun tJava ou dun tJavaFlex. Afin dviter les dsagrments de la saisie, vous pouvez slectionner la variable qui vous intresse dans la liste dautocompltion (Ctrl+Espace) afin de remplir le champ, si cette variable a t correctement dfinie. Pour plus dinformations concernant lutilisation dun flux, consultez la section intitule Scnario 2 : Lire les donnes dun fichier distant en mode stream . File name Chemin daccs et nom du fichier de sortie et/ou variable utiliser. Ce champ est indisponible lorsque vous avez coch la case Use Output Stream. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant dans le Repository.

1224

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileOutputPositional

Built-in : Le schma sera cr et conserv pour ce composant. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Row separator Append Include header Compress as zip file Formats Chane (ex : \n sous Unix) sparant les lignes. Cochez cette option pour ajouter des nouvelles lignes la fin du fichier. Cochez cette case pour tenir compte de len-tte dans le fichier de sortie. Cochez cette case pour compresser en zip le fichier de sortie. Personnalisez le format des donnes du fichier positionnel et renseignez les colonnes du tableau Formats. Column : Slectionnez la colonne que vous souhaitez personnaliser. Size : Saisissez la taille correspondant la colonne. Padding char : Saisissez entre guillemets le caractre de remplissage utiliser. Le caractre par dfaut est un espace. Alignment : Slectionnez le paramtre dalignement appropri. Keep : Si les donnes contenues dans la colonne ou dans le champ sont trop longues, slectionnez la partie que vous souhaitez garder. Advanced settings Advanced separator (for Cochez cette option pour modifier les sparateurs utiliss numbers) pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Use byte length as the car- Cochez cette case pour permettre la prise en charge des dinality caractres deux octets dans ce composant. Pour cette fonction, JDK 1.6 est requis. Create directory if not Cochez cette case pour crer un nouveau dossier si votre exists dossier de destination nexiste pas. Custom the flush buffer size Cochez cette case pour personnaliser le nombre de lignes crire avant de vider le tampon. Row Number : Nombre de lignes crire avant de vider le tampon. Output in row mode Encoding Cochez cette case pour que lcriture se fasse en mode ligne. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est

Guide de Rfrence des Composants Talend Open Studio

1225

Scnario associ :

obligatoire pour la manipulation des donnes des bases de donnes. Dont generate empty file tStatCatcher Statistics Utilisation Cochez cette case pour empcher la gnration dun fichier vide. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Utilisez ce composant pour lire un fichier et sparer les champs laide du sparateur spcifi.

Scnario associ :
Pour un scnario associ, consultez la section intitule Scnario : Transformer un fichier positionnel en fichier XML . Pour un scnario relatif l'utilisation de l'option Use Output Stream, consultez la section intitule Scnario : Utiliser un flux de sortie pour sauvegarder des donnes dans un fichier local .

1226

Guide de Rfrence des Composants Talend Open Studio

tFileOutputProperties

tFileOutputProperties

Proprits du tFileOutputProperties
Famille de composant Fonction Objectif Basic settings File/Output Le composant tFileInputProperties crit un fichier de configuration de type ini ou properties. Il crit un fichier de configuration contenant des donnes texte organises sur le modle cl=valeur. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Pour ce composant, le schma est en lecture seule puisque les fichiers sont structurs sur le modle cl=valeur. Slectionnez le format de votre fichier .properties ou .ini. .properties : fichier de configuration dont les donnes sont disposes sur deux lignes et structures de la manire suivante cl=valeur. .ini : fichier de configuration dont les donnes sont disposes sur deux lignes, structures de la manire suivante cl=valeur. et regroupes en sections.. Section Name : saisissez le nom de la section sur laquelle effectuer lopration ditration. Append File Name Cochez cette option pour ajouter des nouvelles lignes la fin du fichier. Chemin daccs et nom du fichier de sortie, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Advanced settings Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

File format

tStatCatcher Statistics

Utilisation

Utilisez ce composant pour crire un fichier dont les donnes sont organises selon la structure cl=valeur.

Guide de Rfrence des Composants Talend Open Studio

1227

Scnario associ

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Lire et mapper la cl et les valeurs de fichiers properties et alimenter un glossaire de la section la section intitule tFileInputProperties .

1228

Guide de Rfrence des Composants Talend Open Studio

tFileOutputXML

tFileOutputXML

Le tFileOutputXML appartient deux familles de composants : File et XML. Pour plus dinformations concernant le composant tFileOutputXML, consultez la section intitule tFileOutputXML .

Guide de Rfrence des Composants Talend Open Studio

1229

tFileProperties

tFileProperties

Proprits du tFileProperties
Famille du composant Fonction Objectif Basic settings File/Management Le composant tFileProperties permet de crer un flux monoligne affichant les proprits du fichier trait. Le tFileProperties permet de recueillir les informations concernant les proprits principales dun fichier dfini. Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Edit schema File Accs au schma. Chemin daccs et nom du fichier traiter, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Calculate MD5 Hash Advanced settings Utilisation Connections tStatCatcher Statistics Cochez cette case pour vrifier le MD5 du fichier tlcharg. Cochez cette case pour collecter les donnes de log au niveau du composant. Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize.

Ce composant peut tre utilis en standalone.

1230

Guide de Rfrence des Composants Talend Open Studio

Scnario : Afficher les proprits dun fichier trait

Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a

Scnario : Afficher les proprits dun fichier trait


Ce scnario Java dcrit un Job trs simple permettant dafficher les proprits dun fichier spcifi. A partir de la Palette, cliquez-dposez les composants tFileProperties et tLogRow dans lditeur graphique. Cliquez-droit sur le tFileProperties et connectez-le au tLogRow laide dun lien de type Row Main.

Dans lditeur graphique, slectionnez le composant tFileProperties. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFileProperties.

Configurez le champ Schema en mode Built-In. Cliquez sur le bouton [...] du champ Edit schema si vous voulez voir les colonnes en lecture seule. Dans le champ File, saisissez le chemin daccs ou parcourez vos dossiers jusquau fichier dont vous voulez afficher les proprits. Dans lditeur graphique, slectionnez le tLogRow et cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Pour plus dinformations, consultez la section intitule tLogRow . Enregistrez le Job et appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

1231

Scnario : Afficher les proprits dun fichier trait

Les proprits du fichier dfini saffichent dans la console Run.

1232

Guide de Rfrence des Composants Talend Open Studio

tFileRowCount

tFileRowCount

Proprits du tFileRowCount
Famille de composant File/Management Fonction Objectif Basic settings Le composant tFileRowCount compte le nombre de lignes dans un fichier. Ce composant ouvre un fichier et le lit ligne par ligne afin de dterminer le nombre de lignes quil contient. File Name Chemin daccs et nom du fichier traiter, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Row separator Ignore empty rows Encoding Chane (ex : \n sous Unix) sparant les lignes. Cochez cette case pour que les lignes vides ne soient pas prises en compte. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation Global Variables

tStatCatcher Statistics

Le tFileRowCount est un composant standalone, et doit tre utilis avec un lien de type OnSubjobOk vers un tJava. Number of counted lines : retourne le nombre de lignes dans un fichier. Disponible comme variable Flow. Retourne un entier. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide utilisateur Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

1233

Scnario associ :

Scnario associ :
Aucun scnario nest disponible pour ce composant.

1234

Guide de Rfrence des Composants Talend Open Studio

tFileTouch

tFileTouch

Proprits du tFileTouch
Famille de composant File/Management Fonction Objectif Basic settings Le composant tFileTouch cre un fichier vide. Ce composant cre un fichier vide, et cre le rpertoire de destination sil nexiste pas. File Name Chemin daccs et nom du fichier crer, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Create directory if not Cochez cette case pour crer un nouveau dossier si votre dosexists sier de destination nexiste pas. Advanced settings Utilisation Connections tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio.

Ce composant peut tre utilis en standalone.

Scnario associ :
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

1235

tFileUnarchive

tFileUnarchive

Proprits du tFileUnarchive
Famille de composant Fonction Objectif Basic settings File/Management Le composant tFileUnarchive dzippe un fichier archive en fonction des paramtres dfinis et le place dans le rpertoire souhait. Ce composant dzippe un fichier archive de nimporte quel format (zip, rar, etc.) pour un ventuel traitement. Archive file Extraction Directory Chemin daccs au fichier archive. Rpertoire dans lequel le fichier dzipp sera plac.

Use archive name as Cochez cette case pour crer un dossier du mme nom root directory que larchive, sil nexiste pas, dans le rpertoire spcifi et extraire le(s) fichier(s) dzipp(s) dans ce dossier. Check the integrity be- Cochez cette case pour effectuer une vrification fore unzip dintgrit avant de dzipper larchive. Extract file paths Need a password Cochez cette case pour reproduire la structure du chemin daccs au fichier zipp dans larchive. Cochez cette case et saisissez le mot de passe correct si la dcompression de larchive est protge par un mot de passe. Notez que larchive crypte doit tre cre par le composant tFileArchive, sinon des messages derreur apparatront ou rien ne sera extrait, mme si aucun message derreur nest apparu.

Advanced settings Utilisation Global Variables

tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Ce composant peut tre utilis en standalone mais il peut aussi tre utilis en composant de dpart dans un Job via un lien Iterate. Current File : retourne le nom du fichier archive dcompress. Disponible comme variable Flow. Retourne une chane de caractres. Current File Path : retourne le chemin daccs au fichier archive dcompress. Disponible comme variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez leGuide utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Row : Iterate.

1236

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : Run if, OnSubjobOk, OnSubjobError, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez leGuide utilisateur Talend Open Studio. Limitation n/a

Scnario associ
Pour un exemple dutilisation du composant tFileUnarchive, consultez la section intitule tFileCompare .

Guide de Rfrence des Composants Talend Open Studio

1237

tGPGDecrypt

tGPGDecrypt

Proprits du tGPGDecrypt
Famille de conposant Fonction Objectif Basic settings File/Management Le composant tGPGDecrypt dcrypte un fichier crypt GnuPG et sauvegarde le fichier dcrypt dans le rpertoire cible spcifi. Ce composant appelle la commande gpg -d afin de dcrypter un fichier crypt GnuPG et sauvegarde le fichier dcrypt dans le rpertoire spcifi. Input encrypted file Output decrypted file GPG binary path Passphrase No TTY Terminal Chemin daccs au fichier crypt file. Chemin daccs au fichier dcrypt. Chemin daccs la commande GPG. Saisissez la phrase secrte utilise pour crypter le fichier dentre spcifi. Cochez cette case pour spcifier quaucun terminal TTY nest utilis en ajoutant loption --no-tty la commande de dcryptage.

Advanced settings Utilisation Limitation

tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Ce composant peut tre utilis en standalone. n/a

Scnario : Dcrypter un fichier crypt GnuPG et afficher son contenu


Le scnario suivant dcrit un Job de trois composants qui dcrypte un fichier crypt GnuPG et affiche son contenu dans la console de la vue Run.

Dposez un composant tGPGDecrypt, un tFileInputDelimited et un tLogRow de la Palette dans lespace de modlisation graphique.

1238

Guide de Rfrence des Composants Talend Open Studio

Scnario : Dcrypter un fichier crypt GnuPG et afficher son contenu

Reliez le composant tGPGDecrypt au tFileInputDelimited laide dun lien Trigger > OnSubjobOk puis connectez le tFileInputDelimited au tLogRow en utilisant un lien Row > Main. Double-cliquez sur le composant tGPGDecrypt afin douvrir sa vue Component et dfinir ses proprits :

Dans le champ Input encrypted file, parcourez votre rpertoire jusquau fichier dcrypter. Dans le champ Output decrypted file, saisissez le chemin daccs au fichier dcrypt. Si le chemin daccs du fichier contient des caractres accentus, vous obtiendrez un message derreur lors de lexcution du Job. Pour plus dinformations concernant la procdure suivre lorsque les accents ne sont pas supports, consultez le Guide dinstallation Talend Open Studio. Dans le champ GPG binary path, parcourez votre rpertoire jusquau fichier de commandes GPG. Dans le champ Passphrase, saisissez la phrase secrte utilise lors du cryptage du fichier dentre. Double-cliquez sur le composant tFileInputDelimited afin douvrir sa vue Component et dfinir ses proprits :

Dans la liste Property Type, slectionnez Built-In. Dans le champ File name/Stream, dfinissez le chemin daccs au fichier dcrypt, le chemin de sortie dfini dans votre composant tGPGDecrypt. Dans le champ Header, dfinissez le nombre de lignes ignorer au dbut du fichier. Dans cet exemple, saisissez 1. Dans le champ Footer, saisissez le nombre de lignes ignorer la fin du fichier. Dans cet exemple, aucune ligne nest ignorer, saisissez donc 0. Dans le champ Limit, saisissez le nombre de lignes traiter. Saisissez 10. Dans la liste Schema, slectionnez Built-In. Cela signifie que les proprits que vous configurez dans le composant ne seront pas rutilisables dans dautres Jobs. Cliquez sur Edit schema et ditez le schma du composant. Cliquez deux fois sur le bouton [+] pour ajouter deux colonnes que vous nommerez idState et labelState.

Guide de Rfrence des Composants Talend Open Studio

1239

Scnario : Dcrypter un fichier crypt GnuPG et afficher son contenu

Cliquez sur OK afin de valider vos modifications et fermer lditeur.

Double-cliquez sur le composant tLogRow afin dafficher sa vue Component et dfinir ses proprits.

Dans la liste Schema, slectionnez Built-In. Dans la zone Mode, slectionnez loption Table (print values in cells of a table). Sauvegardez votre Job et appuyez sur F6 pour lexcuter.

Le fichier spcifi est dcrypt et le nombre dfini de lignes saffiche dans la console de la vue Run.

1240

Guide de Rfrence des Composants Talend Open Studio

tNamedPipeClose

tNamedPipeClose

Proprits du tNamedPipeClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation File/Input Le composant tNamedPipeClose ferme un tube nomm ouvert par le tNamedPipeOpen, la fin dun processus. Ce composant est utilis pour ferm un tube nomm la fin dun processus. Pipe tStatCatcher Statistics Slectionnez dans la liste un tube nomm existant fermer. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis pour fermer un tube nomm la fin dun Job.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Ecrire et charger des donnes via un tube nomm .

Guide de Rfrence des Composants Talend Open Studio

1241

tNamedPipeOpen

tNamedPipeOpen

Proprits du tNamedPipeOpen
Famille de composant Fonction Objectif Basic settings File/Input Le composant tNamedPipeOpen ouvre un tube nomm pour crire des donnes lintrieur. Ce composant est utilis dans un processus de communication interne, il ouvre un tube nomm pour crire des donnes lintrieur. Name Delete if already exist Advanced settings Utilisation tStatCatcher Statistics Saisissez dans le champ le nom du tube nomm. Cochez cette case si vous ne souhaitez pas dupliquer un tube nomm. Le tube nomm existant sera remplac. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme composant de dbut dans un Job effectuant un processus de communication interne.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Ecrire et charger des donnes via un tube nomm .

1242

Guide de Rfrence des Composants Talend Open Studio

tNamedPipeOutput

tNamedPipeOutput

Proprits du tNamedPipeOutput
Famille de composant Fonction Objectif Basic settings File/Input Le composant tNamedPipeOutput crit des donnes dans un tube nomm ouvert. Ce composant vous permet dcrire des donnes dans un tube nomm ouvert dj existant. Use existing pipe connec- Cochez cette case afin dutiliser un tube nomm existant tion dans la liste Pipe component, ou dcochez cette case afin de spcifier un tube nomm dans le champ Pipe name. Pipe component Slectionnez dans la liste un composant NamedPipe existant. Cette case est disponible uniquement lorsque vous cochez la case Use existing pipe connection. Pipe name Saisissez dans le champ le nom dun tube nomm existant. Cette case saffiche uniquement lorsque vous dcochez la case Use existing pipe connection. Row separator Field separator CSV options Chane (ex : \n sous Unix) sparant les lignes dans le fichier de sortie. Caractre, chane ou expression rgulire pour sparer les champs du fichier de sortie. Cochez cette case afin de prendre en compte tous les paramtres spcifiques aux fichiers CSV, en particulier les paramtres Escape char et Text enclosure. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement leGuide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio.

Schema et Edit Schema

Guide de Rfrence des Composants Talend Open Studio

1243

Scnario : Ecrire et charger des donnes via un tube nomm

Delete pipe if it exists Advanced settings Boolean type tStatCatcher Statistics Utilisation

Cochez cette case si vous ne souhaitez pas dupliquer un tube nomm. Le tube nomm existant sera remplac. Slectionnez un type de boolen dans la liste. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis connect un autre composant dans un sousjob lisant des donnes dune source.

Scnario : Ecrire et charger des donnes via un tube nomm


Le scnario suivant permet de crer un Job crivant des donnes dans un tube nomm ouvert et affichant ces donnes dans la console.

Dposez les composants suivants de la Palette dans lespace de modlisation graphique : tNamedPipeOpen, tParallelize, tNamedPipeClose, tFileInputDelimited, tSleep, tLogRow, tRowGenerator et tNamedPipeOutput. Connectez le tNamedPipeOpen au tParallelize laide dun lien Trigger > OnSubjobOk. Reliez le composant tParallelize au tFileInputDelimited laide dun lien Trigger > Parallelize. Connectez le tParallelize au composant tSleep laide dun lien Trigger > Parallelize. Reliez le tFileInputDelimited au tLogRow laide dun lien Row > Main. Connectez le composant tParallelize au tNamedPipeClose laide dun lien Trigger > Synchronize (Wait for all). Reliez le tSleep au composant tRowGenerator laide dun lien Trigger > OnComponentOk. Connectez le tRowGenerator au tNamedPipeOutput laide dun lien Row > Main. Double-cliquez sur le composant tNamedPipeOpen afin douvrir sa vue Basic settings.

1244

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire et charger des donnes via un tube nomm

Dans le champ Name, saisissez le nom dun tube nomm et slectionnez Delete if already exist afin de ne pas dupliquer ce tube nomm. Double-cliquez sur le tParallelize afin dafficher sa vue Basic settings.

Slectionnez end of all subjobs dans la liste Wait for. Dans le champ Sleep Duration, saisissez 100 pour configurer la dure de pause. Double-cliquez sur le tFileInputDelimited afin dafficher sa vue Basic settings.

Dans le champ File name/Stream, saisissez lexpression suivante pour utiliser le nom du tube nomm existant dfini dans la vue Basic settings du tNamedPipeOpen: ((String)globalMap.get("tNamedPipeOpen_1_PIPE_NATIVE_NAME")) Cliquez sur le bouton [...] ct du champ Edit schema.

Guide de Rfrence des Composants Talend Open Studio

1245

Scnario : Ecrire et charger des donnes via un tube nomm

Cliquez sur le bouton [+] pour ajouter trois colonnes au tFileInputDelimited. Renommez-les id, first_name et last_name puis configurez le Type de la colonne id Integer. Laissez les autres paramtres tels quils sont. Cliquez sur OK afin de sauvegarder le schma. Laissez les autres paramtres de la vue Basic settings tels quils sont. Double-cliquez sur le tSleep et saisissez 1 dans le champ Pause (in seconds). Double-cliquez sur le tRowGenerator pour afficher sa vue Basic settings. Cliquez sur RowGenerator Editor pour configurer le schma.

1246

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire et charger des donnes via un tube nomm

Cliquez sur le bouton [+] pour ajouter trois colonnes au tRowGenerator. Renommez ces trois colonnes respectivement id, first_name et last_name puis configurez le Type de la colonne id Integer. Laissez les autres types tels quils sont par dfaut. Slectionnez sequence dans la liste Functions pour la colonne id. Slectionnez getFirstName dans la liste Functions pour la colonne first_name. Slectionnez TalendDataGenerator.getLastName dans la liste Functions pour la colonne last_name. Slectionnez id, saisissez s1 dans le champ Value sous longlet Function parameters pour sequence identifier, 1001 pour start value et 1 pour step. Cliquez sur OK pour sauvegarder les modifications. Double-cliquez sur le composant tNamedPipeOutput pour afficher sa vue Basic settings.

Cochez la case Use existing pipe connection et slectionnez tNamedPipeOpen_1 dans la liste Pipe component. Cochez la case Delete pipe if it exists pour ne pas dupliquer le tube nomm. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Laissez les autres paramtres tels quils sont. Double-cliquez sur le tLogRow pour afficher sa Basic settings.

Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Dans la zone Mode, slectionnez Table.

Guide de Rfrence des Composants Talend Open Studio

1247

Scnario : Ecrire et charger des donnes via un tube nomm

Double-cliquez sur le tNamedPipeClose afin dafficher sa vue Basic settings. Slectionnez le composant tNamedPipeOpen_1 dans la liste Pipe. Appuyez sur F6 pour excuter le Job.

Les donnes crites dans le tube nomm sont affiches dans la console.

1248

Guide de Rfrence des Composants Talend Open Studio

tPivotToColumnsDelimited

tPivotToColumnsDelimited

Proprits du tPivotToColumnsDelimited
Famille de composant Fonction Objectif Basic settings File/Output Le composant tPivotToColumnsDelimited extrait les donnes en fonction dune opration dagrgation exerce sur une colonne pivot. Le tPivotToColumnsDelimited permet dajuster la slection de donnes transmettre en sortie. Pivot column Aggregation column Aggregation function Group by Slectionnez la colonne qui sert de pivot pour lopration dagrgation dans le flux dentre. Slectionnez la colonne contenant les donnes agrger dans le flux dentre. Slectionnez la fonction utiliser dans le cas o plusieurs valeurs sont disponibles dans la colonne pivot. Dfinissez les ensembles dagrgation dont les valeurs qui sont utilises pour les calculs. Input Column : Faites le lien entre les libells des colonnes dentre et ceux des colonnes de sortie, dans le cas o vous souhaitez que les libells du schma de sortie soient diffrents du schma dentre. File Name Chemin daccs et nom du fichier de sortie, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez leGuide utilisateur de Talend Open Studio. Field separator Row separator Utilisation Limitation n/a Caractre, chane ou expression rgulire pour sparer les champs du fichier de sortie. Chane (ex : \n sous Unix) sparant les lignes.

Ce composant ncessite un flux dentre.

Scnario : Utiliser une colonne pivot pour agrger des donnes


Le scnario suivant dcrit un Job qui agrge des donnes dun fichier dentre dlimit laide dune colonne pivot.

Guide de Rfrence des Composants Talend Open Studio

1249

Scnario : Utiliser une colonne pivot pour agrger des donnes

Cliquez sur les composants suivant et dposez-les dans lespace de modlisation : tFileInputDelimited, tPivotToColumnsDelimited. Le fichier utiliser en entre est compos de 3 colonnes : ID, Question et les rponses correspondantes : Answer

Dans lespace de modlisation, slectionnez le composant tFileInputDelimited. Dfinissez ses proprits dans longlet Basic settings de la vue Component.

Slectionnez le fichier dentre pour renseigner le champ File Name. Dfinissez les sparateurs de lignes (Row) et de champs (Field), respectivement : retour chariot et point virgule, dans cet exemple. Le fichier contient un en-tte, ainsi dfinissez-le. Paramtrez le schma avec les trois colonnes : ID, Questions, Answers. Puis slectionnez le composant tPivotToColumnsDelimited et paramtrez ses proprits dans longlet Basic Settings de la vue Component.

1250

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser une colonne pivot pour agrger des donnes

Dans le champ Pivot column, slectionnez la colonne pivot dans le schma dentre. La colonne pivot est gnralement celle prsentant le plus de doublons (valeurs dagrgation pivot). Dans le champ Aggregation column, slectionnez la colonne agrger dans le schma dentre. Dans le champ Aggregation function, slectionnez la fonction effectuer lorsque des doublons sont trouvs. Dans la table Group by, ajoutez une entre dans la colonne Input column, qui sera utilise pour regrouper la colonne agrge. Dans le champ File Name, indiquez le chemin daccs et le nom du fichier de sortie. Et dans les champs Row et Field separator, paramtrez les sparateurs pour les lignes et donnes de sortie ayant t agrges. Puis, appuyez sur F6 pour excuter le Job. Le fichier de sortie affiche les donnes qui viennent dtre agrges.

Guide de Rfrence des Composants Talend Open Studio

1251

Guide de Rfrence des Composants Talend Open Studio

Composants Internet
Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille Internet de la Palette de Talend Open Studio. La famille Internet regroupe les composants vous permettant daccder du contenu stock sur Internet, des services Web aux e-mails en passant par les flux RSS, le SCP, le MOM, le FTP, etc.

Guide de Rfrence des Composants Talend Open Studio

tFileFetch

tFileFetch

Proprits du tFileFetch
Famille de composant Fonction Objectif Basic settings Internet Le composant tFileFetch rcupre un fichier partir dun protocole. Ce composant permet de rcuprer des donnes dun fichier partir dun protocole. Protocol Slectionnez parmi la liste suivante le protocole utiliser, puis renseignez les champs correspondants : http, https, ftp, smb. Les proprits peuvent diffrer lgrement en fonction du type de protocole slectionn. Les champs additionnels sont dfinis dans ce tableau la suite des proprits gnrales. URI Saisissez lURI du site sur lequel le fichier doit tre rcupr.

Use cache to save the re- Cochez cette case pour enregistrer les donnes dans le source cache. Cette option vous permet de traiter directement le flux de donnes du fichier (en mode stream) sans sauvegarder ce fichier sur votre disque. Elle permet donc un gain de temps et de performance. smb smb Domain Saisissez le nom du domaine du serveur Microsoft. Username et Password Saisissez lidentifiant utilisateur et le mot de passe de connexion au serveur. Destination directory Destination Filename http, https, ftp Slectionnez le rpertoire de destination dans lequel le fichier rcupr sera plac. Saisissez le nouveau nom du fichier rcupr.

Create full path accor- Cette case est coche par dfaut elle permet de reproding to URI duire larborescence de rpertoires de lURI. Pour enregistrer le fichier la racine de votre rpertoire de destination, dcochez la case. Add header Cochez cette case si vous souhaitez ajouter un ou plusieurs en-tte(s) comme conditions de rcupration. Dans le tableau Headers, saisissez le(s) paramtre(s) den-tte HTTP dans le champ Name et la valeur correspondante dans le champ Value. Cette case est coche par dfaut, elle permet dutiliser la mthode POST. Dans le tableau Parameters, saisissez le nom de la ou des variable(s) dans le champ Name et leur valeur correspondante dans le champ Value.

http, https

http, https

POST method

1254

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileFetch

Dcochez cette case si vous souhaitez utiliser la mthode GET. http, https, ftp http, https, ftp, smb http, https, ftp, smb Die on error Read Cookie Save Cookie Dcochez cette case pour passer les lignes en erreur et terminer le traitement des lignes sans erreur. Cochez cette case pour que le tFileFetch charge un cookie dauthentification Web. Cochez cette case pour sauvegarder le cookie dauthentification Web. Cela signifie que vous naurez plus vous identifier sur le mme site Web. Cliquez sur le bouton [...] et parcourez votre rpertoire jusqu lendroit o vous souhaitez sauvegarder votre cookie, ou jusqu lendroit o il est dj sauvegard. Slectionnez une politique relative aux cookies dans la liste droulante. Quatre options sont disponibles : BROWSER_COMPATIBILITY, DEFAULT, NETSCAPE et RFC_2109. Cochez cette case afin de rassembler tous les cookies dans l'en-tte de la requte afin d'obtenir une compatibilit maximum entre les diffrents serveurs. Cochez cette case pour collecter les donnes de log au niveau du composant. Nombre de secondes avant fermeture de la connexion au protocole. to Cochez cette case pour imprimer la rponse du serveur dans la console. Cochez cette case pour charger un ou plusieurs fichier(s) sur le serveur. Dans le champ Name, saisissez le nom du fichier que vous souhaitez charger, et dans le champ File, saisissez le chemin daccs au fichier. Cochez cette case si vous vous connectez derrire un proxy et renseignez les informations correspondantes.

http, https, ftp, smb

Cookie directory

http, https, ftp, smb

Cookie policy

http, https, ftp, smb

Single cookie header

Advanced settings http, https http, https http, https

tStatCatcher Statistics Timeout Print response console Upload file

http, https, ftp http, https, ftp

Enable proxy server

Enable NTLM Creden- Cochez cette case si vous utiliser un protocole tials dauthentification NTLM. Domain : Nom de domaine du client. Host : Adresse IP du client.

http, https

Need authentication

Cochez la case dauthentification et renseignez le nom de lutilisateur dans le champs Username et son mot de passe dans le champs Password, si cela est ncessaire pour accder au protocole. Cochez cette case pour rpter la requte de redirection jusqu ce que la redirection soit effective et que le fichier puisse tre rcupr.

http, https

Support redirection

Utilisation

Ce composant est gnralement utilis en composant de dpart pour alimenter le flux dentre dun Job et est souvent utilis avec un lien de type OnSubjobOk ou OnComponentOk, en fonction du contexte. n/a

Limitation

Guide de Rfrence des Composants Talend Open Studio

1255

Scnario 1 : Rcuprer des donnes partir dun protocole HTTP

Scnario 1 : Rcuprer des donnes partir dun protocole HTTP


Ce scnario dcrit un Job comprenant trois composants, qui retrouve des donnes partir dun site internet HTTP et slectionne des donnes qui seront stockes dans un fichier dlimit.

Cliquez et dposez les composants tFileFetch, tFileInputRegex et tFileOutputDelimited dans lespace de modlisation, puis connectez-les comme illustr sur la figure ci-dessus. Dans longlet Basic settings du composant tFileFetch, slectionnez le protocole que vous souhaitez utiliser. Ici, utilisez le protocole HTTP. Saisissez lURI sur lequel le fichier peut tre rcupr. Dans le champ Destination directory, slectionnez le rpertoire dans lequel le fichier rcupr doit tre stock. Dans le champ Filename, saisissez le nouveau nom du fichier si vous souhaitez le renommer. Dans cet exemple, filefetch.txt. Si ncessaire, cochez la case Add header et dfinissez une ou plusieurs requtes HTTP comme conditions de rcupration. Par exemple, vous pouvez rcuprer le fichier sil a t modifi depuis une date prcise. Dans le tableau Headers, dans le champ Name, saisissez If-Modified-Since puis saisissez "Sat, 29 Oct 1994 19:43:31 GMT" dans le champ Value. Pour plus dinformations concernant la dfinition den-ttes HTTP, consultez Header Field Definitions [http:// www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14] (en anglais). Slectionnez le composant tFileInputRegex. Dans le champ File name paramtrez le nom du fichier afin quil corresponde au fichier rcupr prcdemment. Dans le champ Regex, utilisez une expression rgulire pour slectionner les donnes adquates du fichier rcupr. Dans cet exemple : <td(?: class="leftalign")?> \s* (t\w+) \s* </td> Si ncessaire, dfinissez len-tte dans le champ Header, le pied de page dans le champ Footer et le nombre de lignes traiter dans le champ Limit. Pour cet exemple, ignorez ces champs. Dfinissez le schma dcrivant le flux transmettre au composant de sortie. Le schma devrait tre automatiquement propag au flux de sortie, mais pour en tre sr, vrifiez le schma dans longlet Basic settings du composant tFileOutputDelimited. Puis appuyez sur F6 pour excuter le Job.

1256

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Rutiliser un cookie stock pour rcuprer des fichiers via un protocole HTTP

Scnario 2 : Rutiliser un cookie stock pour rcuprer des fichiers via un protocole HTTP
Ce scnario dcrit un Job comprenant deux composants, qui se connecte un site Web HTTP donn et, laide dun cookie stock dans un rpertoire local spcifi, rcupre les donnes de ce site.

Dposez deux composants tFileFetch de la Palette dans lespace de modlisation graphique. Reliez ces deux composants laide dun lien Trigger > OnSubjobOk Double-cliquez sur le tFileFetch_1 afin douvrir sa vue Component et dfinir ses proprits.

Dans la liste Procotol, slectionnez le protocole que vous souhaitez utiliser. Ici, utilisez le protocole http.

Guide de Rfrence des Composants Talend Open Studio

1257

Scnario 2 : Rutiliser un cookie stock pour rcuprer des fichiers via un protocole HTTP

Dans le champ URI, saisissez lURI via laquelle vous pouvez vous connecter au site Web et rcuprer la page Web. Dans cet exemple, lURI est http://www.codeproject.com/script/Membership/LogOn.aspx?rp=http%3a%2f %2fwww.codeproject.com%2fKB%2fcrossplatform%2fjavacsharp.aspx&download=true. Dans le champ Destination directory, parcourez votre rpertoire jusquau dossier dans lequel stocker le fichier rcupr. Ce dossier sera cr la vole sil nexiste pas. Dans cet exemple, saisissez C:/Logpage. Dans le champ Destination Filename, saisissez un nouveau nom pour le fichier si vous souhaitez le modifier. Dans cet exemple, saisissez webpage.html. Sous le tableau Parameters, cliquez deux fois sur le bouton [+] pour ajouter deux lignes. Dans la colonne Name du tableau Parameters, saisissez respectivement le nom des deux lignes, Email et Password, requises par le site Web auquel vous vous connectez. Dans la colonne Value, saisissez les informations correspondantes, respectivement votre adresse e-mail et votre mot de passe. Cochez la case Save cookie pour activer le champ Cookie directory. Dans le champ Cookie directory, parcourez votre rpertoire jusquau dossier dans lequel vous souhaitez stocker le cookie puis saisissez un nom pour le cookie sauvegarder. Le dossier doit dj exister. Dans cet exemple, le rpertoire est C:/temp/Cookie. Double-cliquez sur le tFileFetch_2 afin douvrir sa vue Component et dfinir ses proprits.

Dans la liste Procotol, slectionnez http. Dans le champ URI, saisissez ladresse partir de laquelle rcuprer les fichiers qui vous intressent. Dans cet exemple, ladresse est http://www.codeproject.com/KB/java/RemoteShell/RemoteShell.zip. Dans le champ Destination directory, parcourez votre rpertoire jusquau dossier dans lequel vous souhaitez stocker les fichiers rcuprs. Ce dossier peut tre automatiquement cr sil nexiste pas durant le processus dexcution. Dans cet exemple, saisissez C:/JavaProject. Dans le champ Destination Filename, saisissez un nouveau nom pour le fichier si vous souhaitez le modifier. Dans cet exemple, saisissez RemoteShell.zip.

1258

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Dcochez la case Post method pour dsactiver le tableau Parameters. Cochez la case Read cookie afin dactiver le champ Cookie directory. Dans le champ Cookie directory, parcourez votre rpertoire jusquau cookie que vous avez sauvegard et que vous souhaitez utiliser. Dans cet exemple, le rpertoire est C:/temp/Cookie. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Vrifiez les dossiers dans lesquels vous avez stock les fichiers rcuprs.

Scnario associ
Pour un exemple de transfert de donnes en mode stream, consultez la section intitule Scnario 2 : Lire les donnes dun fichier distant en mode stream .

Guide de Rfrence des Composants Talend Open Studio

1259

tFileInputJSON

tFileInputJSON

Le composant tFileInputJSON appartient deux familles diffrentes : Internet et File. Pour plus dinformations, consultez la section intitule tFileInputJSON .

1260

Guide de Rfrence des Composants Talend Open Studio

tFTPConnection

tFTPConnection

Proprits du tFTPConnection
Famille de composant Fonction Objectif Basic settings Internet/FTP Le composant tFTPConnection ouvre une connexion FTP afin deffectuer une transaction. Le tFTPConnection permet douvrir une connexion FTP afin deffectuer des transferts de fichiers en une seule transaction. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Port Username Password Adresse IP du serveur FTP. Numro du port dcoute du serveur FTP. Identifiant de connexion au serveur FTP. Mot de passe de connexion au serveur FTP.

SFTP Support/Authen- Cochez cette case puis, partir de la liste droulante tication method Authentication method, slectionnez loption adquate dauthentification au serveur : Password : Renseignez le mot de passe. Public key : Renseignez la cl prive ou cliquez sur le bouton [...] ct du champ Private key pour parcourir vos dossiers jusquau fichier adquat. Si vous choisissez loption Public Key comme mthode dauthentification, assurez-vous que la cl ait t ajoute lagent ou quaucune passphrase (phrase secrte) ne soit demande. Lorsque la case est dcoche, slectionnez votre mode de connexion, Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes, ou Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes. Advanced settings Use Socks Proxy Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis comme sous-job a un seul composant. n/a

Guide de Rfrence des Composants Talend Open Studio

1261

Scnarios associs

Scnarios associs
Pour un scnario associ, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant . Consultez galement la section intitule Scnario : Itration sur un rpertoire distant du tFTPFileList. Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant .

1262

Guide de Rfrence des Composants Talend Open Studio

tFTPDelete

tFTPDelete

Proprits du tFTPDelete
Famille de composant Fonction Objectif Basic settings Internet/FTP Le composant tFTPDelete supprime les fichiers slectionns via une connexion FTP. Le tFTPDelete supprime les fichiers dun serveur FTP distant. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion/Component List adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vous pouvez utiliser longlet Dynamic settings, pour partager la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct travers les deux niveaux de Job. Pour plus dinformations concernant les Dynamic settings, consultez le Guide Utilisateur de votre Studio. Host Port Adresse IP du serveur FTP. Numro du port dcoute du serveur FTP.

Username et Password Informations dauthentification de lutilisateur du serveur FTP. Remote directory Rpertoire source o se trouvent les fichiers supprimer. SFTP Support/Authen- Cochez cette case puis, partir de la liste droulante tication method Authentication method, slectionnez loption adquate dauthentification au serveur : Password : Renseignez le mot de passe. Public key : Renseignez la cl prive ou cliquez sur le bouton [...] ct du champ Private key pour parcourir vos dossiers jusquau fichier adquat. Si vous choisissez loption Public Key comme mthode dauthentification, assurez-vous que la

Guide de Rfrence des Composants Talend Open Studio

1263

Scnarios associs

cl ait t ajoute lagent ou quaucune passphrase (phrase secrte) ne soit demande. Lorsque la case est dcoche, slectionnez votre mode de connexion, Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes, ou Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes. Files Advanced settings Use Socks Proxy Noms ou chemins daccs aux fichiers supprimer. Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy.

Ignore Failure At Quit Cochez cette case afin dignorer les erreurs dues la fer(FTP) meture du FTP ou de la bibliothque. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis comme composant de sortie ou de fin. n/a

Scnarios associs
Pour un scnario associ, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant . Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant .

1264

Guide de Rfrence des Composants Talend Open Studio

tFTPFileExist

tFTPFileExist

Proprits du tFTPFileExist
Famille de composant Fonction Objectif Basic settings Internet/FTP Le composant tFTPFileExist vrifie si un fichier est prsent sur le serveur FTP. Le tFTPFileExist permet de vrifier la prsence dun fichier sur le serveur FTP distant. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion/Component List adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vous pouvez utiliser longlet Dynamic settings, pour partager la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct travers les deux niveaux de Job. Pour plus dinformations concernant les Dynamic settings, consultez le Guide Utilisateur de votre Studio. Host Port Adresse IP du serveur FTP. Numro du port dcoute du serveur FTP.

Username et Password Informations dauthentification de lutilisateur du serveur FTP. Remote directory File Name Rpertoire source o se trouvent les fichiers supprimer. Nom du fichier dont vous voulez vrifier la prsence.

SFTP Support/Authen- Cochez cette case puis, partir de la liste droulante tication method Authentication method, slectionnez loption adquate dauthentification au serveur : Password : Renseignez le mot de passe. Public key : Renseignez la cl prive ou cliquez sur le bouton [...] ct du champ Private key pour parcourir vos dossiers jusquau fichier adquat. Si vous choisissez loption Public Key comme mthode dauthentification, assurez-vous que la

Guide de Rfrence des Composants Talend Open Studio

1265

Scnarios associs

cl ait t ajoute lagent ou quaucune passphrase (phrase secrte) ne soit demande. Lorsque la case est dcoche, slectionnez votre mode de connexion, Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes, ou Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy.

Advanced settings

Use Socks Proxy

Ignore Failure At Quit Cochez cette case afin dignorer les erreurs dues la fer(FTP) meture du FTP ou de la bibliothque. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis comme composant de sortie ou de fin. n/a

Scnarios associs
Pour un scnario associ, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant . Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant .

1266

Guide de Rfrence des Composants Talend Open Studio

tFTPFileList

tFTPFileList

Proprits du tFTPFileList
Famille de composant Fonction Objectif Internet/FTP Le composant tFTPFileList fait une boucle sur les fichiers et/ou les dossiers dun rpertoire distant donn. Le tFTPFileList rcupre un groupe de fichiers et/ou de dossiers suivant un masque donn et fait une boucle sur chacun deux, en se connectant un rpertoire distant via un protocole FTP. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion/Component List adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vous pouvez utiliser longlet Dynamic settings, pour partager la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct travers les deux niveaux de Job. Pour plus dinformations concernant les Dynamic settings, consultez le Guide utilisateur de votre Studio. Host Port Remote directory File detail Adresse IP. Numro du port dcoute. Chemin daccs au rpertoire distant. Cochez cette case pour voir toutes les informations du fichier, et non pas juste son nom.

Basic settings

Username et Password Informations dauthentification de lutilisateur.

SFTP Support/Authen- Cochez cette case puis, partir de la liste droulante tication method Authentication method, slectionnez loption adquate dauthentification au serveur : Password : Renseignez le mot de passe. Public key : Renseignez la cl prive ou cliquez sur le bouton [...] ct du champ Private key pour parcourir vos dossiers jusquau fichier adquat.

Guide de Rfrence des Composants Talend Open Studio

1267

Scnario : Itration sur un rpertoire distant

Si vous choisissez loption Public Key comme mthode dauthentification, assurez-vous que la cl ait t ajoute lagent ou quaucune passphrase (phrase secrte) ne soit demande. Lorsque la case est dcoche, slectionnez votre mode de connexion, Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes, ou Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes. Connect Mode Slectionnez le mode adquat de connexion au serveur : Active : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes. Passive : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes. Advanced settings Use Socks Proxy Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy.

Ignore Failure At Quit Cochez cette case afin dignorer les erreurs dues la fer(FTP) meture du FTP ou de la bibliothque. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Le composant tFTPFilelist est gnralement utilis comme composant seul dans un sous-job mais il peut aussi tre utilis avec dautres composants.

Scnario : Itration sur un rpertoire distant


Le scnario suivant dcrit un Job de trois composants qui a pour objectif de se connecter un serveur FTP, de lister les fichiers dun rpertoire distant donn en fonction dun masque, de les rcuprer et de les envoyer vers un rpertoire local dfini.

Cliquez et dposez les composants suivants : tFTPConnection, tFTPFileList et tFTPGet dans lespace de modlisation. Cliquez droit sur le composant tFTPConnection et connectez-le au composant tFTPFileList via une connexion de type OnSubjobOk. Puis connectez le tFTPFileList au tFTPGet laide dune connexion de type Iterate. Slectionnez le tFTPConnection et cliquez sur longlet Basic settings de la vue Component pour paramtrer le composant :

1268

Guide de Rfrence des Composants Talend Open Studio

Scnario : Itration sur un rpertoire distant

Dans le champ Host, renseignez ladresse IP du serveur FTP. Dans le champ Port, renseignez le numro du port dcoute. Dans les champs Username et Password, renseignez respectivement le login et le mot de passe de connexion au serveur distant. Dans la liste Connect Mode, slectionnez le mode de connexion au serveur FTP que vous souhaitez utiliser. Slectionnez le tFTPFileList et cliquez sur longlet Basic settings de la vue Component pour paramtrer le composant :

Cochez la case Use an existing connection et dans la liste Component list, slectionnez le composant de connexion tFTPConnection_1. Les informations de connexion sont automatiquement renseignes. Dans le champ Remote directory, renseignez le chemin relatif du rpertoire contenant les fichiers lister. Dans le champ Filemask, indiquez un masque de fichier. Utilisez les caractres spciaux si besoin est. Dans cet exemple, on ne veut rcuprer que les fichiers dlimits (.csv). Dans la liste Connect Mode, slectionnez le mode de connexion au serveur FTP que vous souhaitez utiliser. Dans cet exemple, il sagit du mode Passive. Slectionnez le tFTPGet et cliquez sur longlet Basic settings de la vue Component pour paramtrer le composant :

Guide de Rfrence des Composants Talend Open Studio

1269

Scnario : Itration sur un rpertoire distant

Cochez la case Use an existing connection et dans la liste Component list, slectionnez le composant de connexion adquat, tFTPConnection_1 dans cet exemple. Les informations de connexion sont automatiquement renseignes. Dans le champ Local directory, renseignez le chemin relatif du rpertoire de destination des fichiers rcuprer. Dans le champ Remote directory, renseignez le chemin relatif du rpertoire contenant les fichiers rcuprer. Dans la liste Transfer Mode, slectionnez le mode de transfert FTP que vous souhaitez utiliser. Dans la liste Overwrite file, slectionnez lune des options disponibles pour le transfert du fichier. Dans le champ Filemask, slectionnez la variable globale ((String)globalMap.get("tFTPFileList_1_CURRENT_FILEPATH")) de manire traiter tous les fichiers du rpertoire source. Dans la liste Connect Mode, slectionnez le mode de connexion au serveur FTP que vous souhaitez utiliser. Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Une fois la connexion au serveur FTP tablie, les fichiers sont lists dans le rpertoire spcifi, selon le masque choisi, puis sont rcuprs et stocks dans le rpertoire de destination pralablement dfini. Vous pouvez vrifier que la copie des fichiers a t ralise partir de votre explorateur de disque.

1270

Guide de Rfrence des Composants Talend Open Studio

tFTPFileProperties

tFTPFileProperties

Proprits du tFTPFileProperties
Famille du composant Fonction Objectif Basic settings Internet Le composant tFTPFileProperties permet de crer un flux monoligne affichant les proprits du fichier trait sur un serveur FTP. Le tFTPFileProperties permet de recueillir les informations concernant les proprits principales dun fichier dfini sur un serveur FTP. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema type Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Edit schema Accs au schma. Use an existing connec- Cochez la case et cliquez sur le composant de tion/Component List connexion adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Host Port Username Password Local directory Remote directory File Adresse IP du serveur FTP. Numro du port dcoute du serveur FTP. Login de connexion au serveur FTP. Mot de passe de connexion au serveur FTP. Chemin daccs lemplacement de destination du fichier. Chemin daccs du rpertoire source o les fichiers sont rcuprs. Nom du fichier traiter. Voir galement le Guide utilisateur de Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

1271

Scnario associ

SFTP Support/Authen- Cochez cette case puis, partir de la liste droulante tication method Authentication method, slectionnez loption adquate dauthentification au serveur : Password : Renseignez le mot de passe. Public key : Renseignez la cl prive ou cliquez sur le bouton [...] ct du champ Private key pour parcourir vos dossiers jusquau fichier adquat. Si vous choisissez loption Public Key comme mthode dauthentification, assurez-vous que la cl ait t ajoute lagent ou quaucune passphrase (phrase secrte) ne soit demande. Lorsque la case est dcoche, slectionnez votre mode de connexion, Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes, ou Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case pour vrifier le MD5 du fichier tlcharg. Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy.

Calculate MD5 Hash Advanced settings Use Socks Proxy

Ignore Failure At Quit Cochez cette case afin dignorer les erreurs dues la (FTP) fermeture du FTP ou de la bibliothque. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en standalone. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Afficher les proprits dun fichier trait .

1272

Guide de Rfrence des Composants Talend Open Studio

tFTPGet

tFTPGet

Proprits du tFTPGet
Famille de composant Fonction Objectif Basic settings Internet/FTP Le composant tFTPGet rcupre les fichiers slectionns via une connexion FTP. Le tFTPGet rcupre les fichiers slectionns dun serveur FTP distant et les copie dans un rpertoire local. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion/Component List adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Host Port Username Password Local directory Remote directory Transfer mode Overwrite file Adresse IP du serveur FTP. Numro du port dcoute du serveur FTP. Login de connexion au serveur FTP. Mot de passe de connexion au serveur FTP. Chemin daccs lemplacement de destination du fichier. Chemin daccs du rpertoire source o les fichiers sont rcuprs. Diffrents modes de transfert FTP. Liste des options disponibles pour le transfert du fichier. Append : Cochez cette case pour crire les donnes la fin de lenregistrement, et ainsi ne pas lcraser. SFTP Support Lorsque vous cochez cette case, les champs Overwrite file et Authentication method saffichent. Overwrite file vous propose trois options : Overwrite : pour craser le fichier dj existant. Resume : pour reprendre le tlchargement du fichier l o il a t interrompu. Append : pour crire la suite du fichier sans lcraser. Authentication vous dauthentification : propose deux modes

Public key : Renseignez le chemin daccs la cl publique. Password : Renseignez le mot de passe.

Guide de Rfrence des Composants Talend Open Studio

1273

Scnario associ

FTPS Support

Cochez cette case si vous souhaitez vous connecter au serveur FTP via une connexion FTPS. Deux champs apparaissent : Keystore File : Saisissez le chemin daccs au keystore (fichier protg par un mot de passe, qui peut contenir plusieurs cls et certificats). Keystore Password : saisissez votre mot de passe correspondant au keystore.

Files Connection Mode

Noms ou chemins daccs aux fichiers transfrer. Slectionnez votre mode de connexion. Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes. Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes.

Encoding

Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et les lignes contenant les erreurs seront ignores. Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy.

Die on error

Advanced settings

Use Socks Proxy

Ignore Failure At Quit Cochez cette case afin dignorer les erreurs dues la fer(FTP) meture du FTP ou de la bibliothque. Print message tStatCatcher Statistics Utilisation Limitation Cochez cette case pour afficher dans la console la liste des fichiers tlchargs. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme sous-Job a un seul composant mais il peut aussi tre utilis comme composant de sortie ou de fin. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant . Consultez galement la section intitule Scnario : Itration sur un rpertoire distant du tFTPFileList. Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant .

1274

Guide de Rfrence des Composants Talend Open Studio

tFTPPut

tFTPPut

Proprits du tFTPPut
Famille de composant Fonction Objectif Basic settings Internet/FTP Le composant tFTPPut copie les fichiers slectionns via une connexion FTP. Le tFTPPut copie les fichiers slectionns dun rpertoire local dfini vers un rpertoire FTP distant. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion/Component List adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vous pouvez utiliser longlet Dynamic settings, pour partager la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct travers les deux niveaux de Job. Pour plus dinformations concernant les Dynamic settings, consultez le Guide Utilisateur de votre Studio. Host Port Username Password Local directory Remote directory Transfer mode Overwrite file Adresse IP du serveur FTP. Numro du port dcoute du serveur FTP. Login de connexion au serveur FTP. Mot de passe de connexion au serveur FTP. Chemin daccs au rpertoire source du ou des fichier(s). Chemin daccs au rpertoire de destination du ou des fichier(s). Diffrents modes de transfert FTP. Liste des options disponibles pour le fichier transfr. Append : Cochez cette case pour crire les donnes la fin de lenregistrement, et ainsi ne pas lcraser. SFTP Support et Au- SFTP Support: cochez cette case pour tablir une mthentication method thode dauthentification. Authentication method : slectionnez la mthode dauthentification partir de la liste droulante.

Guide de Rfrence des Composants Talend Open Studio

1275

Scnario : Copier des fichiers sur un serveur FTP distant

Files

Cliquez sur le bouton [+] pour ajouter une ligne puis remplissez les colonnes. Filemask: noms et chemins daccs aux fichiers transfrer. New name: nom donner au fichier FTP aprs le transfert.

Connection Mode

Slectionnez votre mode de connexion. Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes. Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes.

Encoding

Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et les lignes contenant les erreurs seront ignores. Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy.

Die on error

Advanced settings

Use Socks Proxy

Ignore Failure At Quit Cochez cette case afin dignorer les erreurs dues la fer(FTP) meture du FTP ou de la bibliothque. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme sous-Job a un seul composant mais il peut aussi tre utilis comme composant de sortie ou de fin. n/a

Scnario : Copier des fichiers sur un serveur FTP distant


Ce scnario cre un Job deux composants permettant douvrir une connexion un serveur distant afin de copier les fichiers souhaits en une seule transaction.

1276

Guide de Rfrence des Composants Talend Open Studio

Scnario : Copier des fichiers sur un serveur FTP distant

Cliquez et dposez les composants tFTPConnection permettant deffectuer toutes les oprations en une seule transaction et tFTPPut de la famille Internet dans le Job Designer. Reliez le tFTPConnection au tFTPPut laide dun lien de type OnSubJobOk. Dans le Job designer, double-cliquez sur le tFTPConnection pour paramtrer ses proprits de base dans longlet Basic settings de la vue Component :

Dans le champ Host, renseignez ladresse IP du serveur. Dans le champ Port, renseignez le numro du port dcoute. Dans les champs Username et Password, renseignez respectivement le login et le mot de passe de connexion au serveur distant. Dans la liste Connection Mode, slectionnez le mode de connexion au serveur FTP que vous souhaitez utiliser. Dans le Job designer, double-cliquez sur le tFTPPut pour paramtrer ses proprits de base dans longlet Basic settings de la vue Component :

Guide de Rfrence des Composants Talend Open Studio

1277

Scnario : Copier des fichiers sur un serveur FTP distant

Cochez la case Use an existing connection et dans la liste Component list, slectionnez le composant de connexion tFTPConnection_1. Les informations de connexion sont automatiquement renseignes. Dans le champ Local directory, renseignez le chemin daccs au rpertoire local contenant le fichier, moins que vous ne renseigniez directement les masques des fichiers dans la colonne Filemask du champ Files. Dans le champ Remote directory, renseignez les informations de connexion au rpertoire du seveur distant. Dans la liste Transfert mode, slectionnez le mode de transfert utilis. Dans la liste Overwrite file, slectionnez loption dcrasement du fichier. Dans le tableau Files, cliquez deux fois sur le bouton [+] pour ajouter deux lignes la liste Filemask, renseignez les masques de fichier pour chaque fichier que vous souhaitez copier dans le rpertoire distant. Enregistrez votre Job et appuyez sur F6 pour lexcuter. Les fichiers spcifis dans le champ Filemask sont copis dans le rpertoire du serveur distant.

1278

Guide de Rfrence des Composants Talend Open Studio

tFTPRename

tFTPRename

Proprits du tFTPRename
Famille de composant Fonction Objectif Basic settings Internet/FTP Le composant tFTPRename renomme les fichiers slectionns via une connexion FTP. Le tFTPRename renomme les fichiers slectionns dun rpertoire local dfini vers un rpertoire FTP distant. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion/Component List adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vous pouvez utiliser longlet Dynamic settings, pour partager la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct travers les deux niveaux de Job. Pour plus dinformations concernant les Dynamic settings, consultez le Guide Utilisateur de votre Studio. Host Port Username Password Remote directory Overwrite file Adresse IP du serveur FTP. Numro du port dcoute du serveur FTP. Login de connexion au serveur FTP. Mot de passe de connexion au serveur FTP. Chemin daccs au rpertoire de destination du ou des fichier(s). Liste des options disponibles pour le fichier transfr. Append : Cochez cette case pour crire les donnes la fin de lenregistrement, et ainsi ne pas lcraser. SFTP Support et Au- SFTP Support : cochez cette case pour tablir une mthentication method thode dauthentification. Authentication method : slectionnez la mthode dauthentification partir de la liste droulante. Files Cliquez sur le bouton [+] pour ajouter une ligne puis remplissez les colonnes.

Guide de Rfrence des Composants Talend Open Studio

1279

Scnario associ

Filemask : noms et chemins daccs aux fichiers transfrer. New name : nom donner au fichier FTP aprs le transfert. Connection Mode Slectionnez votre mode de connexion. Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes. Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et les lignes contenant les erreurs seront ignores. Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy.

Die on error

Advanced settings

Use Socks Proxy

Ignore Failure At Quit Cochez cette case afin dignorer les erreurs dues la fer(FTP) meture du FTP ou de la bibliothque. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme sous-Job a un seul composant mais il peut aussi tre utilis comme composant de sortie ou de fin. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant .

1280

Guide de Rfrence des Composants Talend Open Studio

tFTPTruncate

tFTPTruncate

Proprits du tFTPTruncate
Famille de composant Fonction Objectif Basic settings Internet/FTP Le composant tFTPTruncate tronque les fichiers slectionns via une connexion FTP. Le tFTPTruncate tronque les fichiers slectionns dun rpertoire local dfini vers un rpertoire FTP distant. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion/Component List adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vous pouvez utiliser longlet Dynamic settings, pour partager la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct travers les deux niveaux de Job. Pour plus dinformations concernant les Dynamic settings, consultez le Guide Utilisateur de votre Studio. Host Port Username Password Remote directory Adresse IP du serveur FTP. Numro du port dcoute du serveur FTP. Login de connexion au serveur FTP. Mot de passe de connexion au serveur FTP. Chemin daccs au rpertoire de destination du ou des fichier(s).

SFTP Support et Au- SFTP Support : cochez cette case pour tablir une mthentication method thode dauthentification. Authentication method : slectionnez la mthode dauthentification partir de la liste droulante. Files Cliquez sur le bouton [+] pour ajouter une ligne puis remplissez les colonnes. Filemask : noms et chemins daccs aux fichiers transfrer.

Guide de Rfrence des Composants Talend Open Studio

1281

Scnario associ

New name : nom donner au fichier FTP aprs le transfert. Connection Mode Slectionnez votre mode de connexion. Passive : vous dterminez le port de connexion utiliser pour permettre le transfert des donnes. Active : le serveur FTP dtermine le port de connexion utiliser pour permettre le transfert des donnes. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case si vous souhaitez utiliser un proxy, puis paramtrez les champs Host, Port, User et Password du proxy.

Advanced settings

Use Socks Proxy

Ignore Failure At Quit Cochez cette case afin dignorer les erreurs dues la fer(FTP) meture du FTP ou de la bibliothque. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme sous-Job a un seul composant mais il peut aussi tre utilis comme composant de sortie ou de fin. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant .

1282

Guide de Rfrence des Composants Talend Open Studio

tHttpRequest

tHttpRequest

Proprits du tHttpRequest
Famille de composant Fonction Objectif Internet Ce composant envoie une requte HTTP au serveur et obtient des rponses HTTP du serveur. Le composant tHttpRequest vous permet denvoyer des requtes HTTP au serveur et dcrire les rponses localement. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur deTalend Open Studio. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Sync columns URI Cliquez sur ce bouton pour rcuprer le schma du composant prcdent. Saisissez lURI (Identifiant uniforme de ressource) partir duquel seront identifies les ressources sur le serveur. Un URI est similaire un URL mais il est plus gnrique. Slectionnez dans la liste la mthode pour dfinir laction effectuer : Post : Choisissez cette mthode pour envoyer des donnes ct serveur (des donnes de formulaires HTML par exemple). Get : Choisissez cette mthode pour rcuprer des donnes ct serveur. Write response content Cochez cette case afin de sauvegarder la rponse HTTP to file dans un fichier local. Vous pouvez soit renseigner le chemin daccs au fichier dentre, soit cliquer sur [...] pour choisir le chemin daccs dans votre systme de fichiers. Headers Renseignez la (les) paire(s) nom-valeur des en-ttes HTTP pour dfinir les paramtres de lopration HTTP requise : Header key : Saisissez le nom du champ den-tte de len-tte HTTP. Value : Saisissez le contenu du champ den-tte de lentte HTTP.

Method

Guide de Rfrence des Composants Talend Open Studio

1283

Scnario : Envoyer une requte HTTP au serveur et sauvegarder localement les rponses HTTP obtenues

Pour plus dinformations concernant la dfinition des en-ttes HTTP, consultez (en anglais) : http:// en.wikipedia.org/wiki/List_of_HTTP_headers. Need authentication Cochez cette case afin de saisir un identifiant et un mot de passe dans les champs correspondants si une authentification est ncessaire : user : Saisissez lidentifiant de connexion au serveur. password : Saisissez le mot de passe de connexion au serveur. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant peut tre utilis pour lenvoi de requtes HTTP au serveur ainsi que pour lenregistrement des rponses HTTP obtenues. Il peut tre utilis en standalone. N/A

Limitation

Scnario : Envoyer une requte HTTP au serveur et sauvegarder localement les rponses HTTP obtenues
Ce scnario Java dcrit un Job deux composants qui utilise la mthode GET pour rcuprer des informations du serveur et crire les rponses dans un fichier local ainsi que dans la console. A partir de la Palette, dposez les composants suivants dans lespace de modlisation graphique : un composant tHttpRequest et un tLogRow.

Connectez le composant tHttpRequest au composant tLogRow laide dune connexion de type Row > Main. Double-cliquez sur le composant tHttpRequest pour ouvrir longlet Basic settings de sa vue Component et paramtrer ses proprits.

1284

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoyer une requte HTTP au serveur et sauvegarder localement les rponses HTTP obtenues

Saisissez http://192.168.0.63:8081/testHttpRequest/build.xml dans le champ URI. Notez que ladresse URI fournie dans ce scnario est destine essentiellement la dmonstration, ce nest pas une adresse valide. Slectionnez GET dans la liste droulante Method. Cochez la case Write response content to file et renseignez le chemin daccs dans le champ de saisie manuelle qui apparat.Pour ce scnario, saisissez .D:/test.txt. Cochez la case Need authentication. Pour ce scnario, saisissez tomcat dans les champs user et password qui apparaissent. Double-cliquez sur le composant tLogRow pour ouvrir longlet Basic settings de sa vue Component et slectionnez Table dans le champ Mode. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. La rponse HTTP du serveur est alors sauvegarde et affiche.

Guide de Rfrence des Composants Talend Open Studio

1285

tJMSInput

tJMSInput

Proprits du tJMSInput
Famille de composant Fonction Objectif Internet Ce composant cre une interface entre une application Java et un systme Middleware orient Message. Le tJMSInput permet de mettre en place des interactions entre composants applicatifs dans un cadre faiblement coupl, asynchrone et fiable via un serveur JMS. Module List Context Provider Slectionnez dans cette liste la bibliothque utiliser. Saisissez l'URL de contexte, par exemple "com.tibco.tibjms.naming.TibjmsInitialContextFactory". Attention cependant, la syntaxe peut varier selon le serveur JMS utilis Saisissez lURL du serveur en respectant la syntaxe, par exemple "tibjmsnaming://localhost:7222". Factory Saisissez le nom JDNI. User Si vous devez vous identifier, cochez la case et saisissez votre nom dutilisateur et votre mot de passe. Slectionnez le type de message, Topic ou Queue. Saisissez la source du message, telle quattendue par le serveur. Celle-ci peut tre compos du type et du nom de la source, par exemple : queue/A ou topic/testtopic. Notez que ce champ est sensible la casse. Timeout for Next Mes- Renseignez le dlai (en secondes) avant de passer au sage (in sec) message suivant. Maximum Messages Saisissez le nombre maximal de messages traiter. Message Selector Ex- Spcifiez votre filtre. pression Processing Mode Slectionnez le mode de traitement des messages : Raw Message : message brut, Message Content : contenu du message. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma du composant tJMSInput est en lecture seule. Il est compos dune colonne : Message. Advanced settings Properties Cliquez sur le bouton [+] sous le tableau afin dajouter des lignes contenant le nom et le mot de passe de lutilisateur requis lauthentification.

Basic settings

Server URL Connection JDNI Name

Use Specified Identity Message Type Message From

1286

Guide de Rfrence des Composants Talend Open Studio

Scnario associ :

tStatCatcher Statistics Utilisation Limitation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis en tant que composant de dbut. Il requiert un composant de sortie. Assurez-vous que le serveur JMS correspondant est lanc.

Scnario associ :
Pour un scnario associ, consultez la section intitule Scnario : Communication asynchrone via un serveur MOM .

Guide de Rfrence des Composants Talend Open Studio

1287

tJMSOutput

tJMSOutput

Proprits du tJMSOutput
Famille de composant Fonction Objectif Internet Ce composant cre une interface entre une application Java et un systme Middleware orient Message. Le tJMSOutput permet de mettre en place des interactions entre composants applicatifs dans un cadre faiblement coupl, asynchrone et fiable via un serveur JMS. Module List Context Provider Slectionnez dans cette liste la bibliothque utiliser. Saisissez l'URL de contexte, par exemple "com.tibco.tibjms.naming.TibjmsInitialContextFactory". Attention cependant, la syntaxe peut varier selon le serveur JMS utilis Saisissez lURL du serveur en respectant la syntaxe, par exemple "tibjmsnaming://localhost:7222". Factory Saisissez le nom JDNI. User Si vous devez vous identifier, cochez la case et saisissez votre nom dutilisateur et votre mot de passe. Slectionnez le type de message, Topic ou Queue. Saisissez la cible du message, telle quattendue par le serveur. Slectionnez le mode de traitement des messages : Raw Message : message brut, Message Content : contenu du message. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma du composant tJMSInput est en lecture seule. Il est compos dune colonne : Message. Advanced settings Delivery Mode Slectionnez un mode de rception dans la liste afin dassurer la qualit des donnes lors de la rception : Not Persistent : Ce mode autorise les pertes de donnes durant lchange. Persistent : Ce mode assure lintgrit du message la rception. Properties Cliquez sur le bouton [+] sous le tableau afin dajouter des lignes contenant le nom et le mot de passe de lutilisateur requis lauthentification.

Basic settings

Server URL Connection JDNI Name

Use Specified Identity Message Type To Processing Mode

1288

Guide de Rfrence des Composants Talend Open Studio

Scnario associ :

tStatCatcher Statistics Utilisation Limitation

Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est gnralement utilis en tant que composant de sortie. Il requiert un composant dentre. Assurez-vous que le serveur JMS correspondant est lanc.

Scnario associ :
Pour un scnario associ, consultez la section intitule Scnario : Communication asynchrone via un serveur MOM .

Guide de Rfrence des Composants Talend Open Studio

1289

tMicrosoftMQInput

tMicrosoftMQInput

Proprits du tMicrosoftMQInput
Famille de composant Fonction Internet/MOM et JMS Le composant tMicrosoftMQInput rcupre le premier message dune file dattente de message Microsoft donne (le composant supporte uniquement le type String). Ce composant vous permet de rcuprer les messages un par un dans lordre de leur ID, dans la file dattente de message Microsoft. Chaque excution rcupre un seul message. PROPERTY Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Queue Advanced settings Utilisation Connexions tStatCatcher Statistics Saisissez le nom de lhte ou ladresse IP du serveur hte. Saisissez le nom de la file dattente partir de laquelle vous souhaitez rcuprer les messages. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant..

Objectif

Basic settings

Ce composant est gnralement utilis en tant que composant de dbut dans un Job ou un sous-job. Il doit tre li un composant de sortie. Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Subjob Ok, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Main, Iterate Trigger : Run if, On Subjob Ok, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio.

Limitation

Ce composant ne supporte que le type String.

1290

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire et rcuprer des messages dans une file dattente de message Microsoft

Scnario : Ecrire et rcuprer des messages dans une file dattente de message Microsoft
Ce scnario se compose de deux Jobs. Le premier Job poste des messages dans une file de message Microsoft et le second Job rcupre les messages du serveur. Dans le premier Job, un message de type string est cr via un tRowGenerator et post dans une file dattente de message Microsoft laide dun composant tMicrosoftMQOutput. Un composant tLogRow intermdiaire affiche le flux pass dun composant lautre.

Dposez de la Palette dans lespace de modlisation graphique un tRowGenerator, un tLogRow et un tMicrosoftMQOutput. Cliquez-droit sur le composant tRowGenerator afin douvrir son menu contextuel. Dans ce menu, slectionnez Row > Main afin de relier ce composant au tLogRow. Effectuez la mme opration pour relier le tLogRow au tMicrosoftMQOutput. Double-cliquez sur le tRowGenerator afin douvrir son diteur.

Dans cet diteur, cliquez sur le bouton [+] pour ajouter trois lignes au schma. Dans la colonne Column, saisissez un nouveau nom pour chaque ligne, afin de les renommer. Ici, saisissez respectivement ID, Name et Address. Dans la colonne Type, slectionnez Integer pour la ligne ID dans la liste droulante et laissez les autres lignes en String. Dans la colonne Functions, slectionnez random pour la ligne ID, getFirstName pour la ligne Name et getUsCity pour la ligne Address. Dans le champ Number of Rows for RowGenerator, saisissez 12 afin de limiter le nombre de lignes gnrer. Cliquez sur OK pour valider vos modifications. Lors dune utilisation relle, vous devrez utiliser un composant dentre pour charger les donnes qui vous intressent, au lieu du tRowGenerator.

Guide de Rfrence des Composants Talend Open Studio

1291

Scnario : Ecrire et rcuprer des messages dans une file dattente de message Microsoft

Double-cliquez sur le composant tMicrosoftMQOutput afin douvrir sa vue Component.

Dans le champ Host, saisissez ladresse de lhte. Dans cet exemple, saisissez localhost. Dans le champ Queue, saisissez le nom de la file de messages dans laquelle vous souhaitez crire le message. Dans cet exemple, nommez-la AddressQueue. Dans le champ Message column (String Type), slectionnez Address dans la liste droulante afin de dterminer le corps du message crire. Appuyez sur F6 pour excuter le Job.

Vous pouvez voir que la file a t cre automatiquement et que les messages ont t crits. Crez ensuite le second Job pour rcuprer le premier message de la file dattente.

Dposez un tMicrosoftMQInput et un tLogRow de la Palette dans lespace de modlisation graphique.

1292

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire et rcuprer des messages dans une file dattente de message Microsoft

Reliez ces deux composants laide dun lien Row > Main. Double-cliquez sur le tMicrosoftMQInput afin douvrir sa vue Component.

Dans le champ Host, saisissez le nom ou ladresse de lhte. Ici, saisissez localhost. Dans le champ Queue, saisissez le nom de la file dattente de message aprtir de laquelle vous souhaitez rcuprer le message. Dans cet exemple, saisissez AddressQueue. Appuyez sur F6 pour excuter le Job.

Le corps du message Atlanta rcupr de la file dattente saffiche dans la console.

Guide de Rfrence des Composants Talend Open Studio

1293

tMicrosoftMQOutput

tMicrosoftMQOutput

Proprits du tMicrosoftMQOutput
Famille de composant Fonction Internet/MOM et JMS Le composant tMicrosoftMQOutput crit une colonne dfinie dun flux dentre de donnes dans une file de messages Microsoft (le composant supporte uniquement le type String). Ce composant permet dcrire des messages dans une file dattente de messages Microsoft. PROPERTY Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Host Queue Saisissez le nom de lhte ou ladresse IP du serveur hte. Saisissez le nom de la file de messages dans laquelle vous souhaitez crire un message. Cette file peut tre cre automatiquement la vole si elle nexiste pas. Slectionnez le message crire dans la file de messages Microsoft. Le message slectionn doit tre de type String. Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio. Limitation Le message crire ne peut tre null.

Objectif Basic settings

Message column

Utilisation Connexions

Ce composant doit tre li un composant dentre ou intermdiaire.

1294

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Ecrire et rcuprer des messages dans une file dattente de message Microsoft

Guide de Rfrence des Composants Talend Open Studio

1295

tMomCommit

tMomCommit

Proprits du tMomCommit
Ce composant est troitement li au composant tMomRollback. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Internet Le composant tMomCommit commite des donnes sur le serveur MQ. En utilisant une connexion unique, commitez en une seule fois une transaction globale au lieu de commiter chaque ligne ou chaque lot de lignes. Ce composant permet un gain de performance. Component list MQ Server Close connection Slectionnez dans la liste le composant de connexion du le Job en cours. Slectionnez dans cette liste le serveur MOM utiliser. Cette option est coche par dfaut. Elle permet de fermer la connexion la base de donnes une fois le commit effectu. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Si vous utilisez un lien de type Row > Main pour relier le tMomCommit votre Job, vos donnes seront commites ligne par ligne. Dans ce cas, ne cochez pas la case Close connection car la connexion sera ferme avant la fin du commit de votre premire ligne. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est gnralement utilis avec des composants Mom, notamment avec le composant tMomRollback. n/a

Scnario associ
Pour plus dinformations relatives au fonctionnement du composant tMomCommit, consultez la section intitule Proprits du tMysqlConnection

1296

Guide de Rfrence des Composants Talend Open Studio

tMomInput

tMomInput

Proprits du tMomInput
Famille de composant Fonction Objectif Basic settings Internet Ce composant rcupre un message dune file dattente dun systme Middleware orient Message et le passe au composant suivant. Le tMomInput permet de mettre en place des communications asynchrones via un serveur MOM. Keep Listening Cochez cette case pour consulter en continu le serveur MOM pour rcuprer les nouveaux messages. - Si vous slectionnez le serveur JBoss Messaging, cocher cette case fera apparatre le champ Sleeping time (in sec). - Si vous slectionnez le serveur ActiveMQ, cocher cette case fera disparatre le champ Sleeping time (in sec). Sleeping time (in sec) Saisissez en secondes la frquence de variation. Ce champ nest pas disponible si vous slectionnez le serveur Websphere MQ dans la liste MQ Server. MQ Server Slectionnez dans cette liste le serveur MOM utiliser. Les paramtres requis diffrent lgrement en fonction du serveur slectionn. Renseignez le nom de lhte (Host) et ladresse IP du serveur MOM ainsi que le Port. Identifiant de connexion au serveur MQ. Mot de passe de connexion au serveur MQ. Saisissez la source du message, telle quattendue par le serveur. Celle-ci peut tre compos du type et du nom de la source, par exemple : queue/A ou topic/testtopic. Notez que ce champ est sensible la casse. Ce champ nest pas disponible si vous slectionnez le serveur Websphere MQ dans la liste MQ Server. Message Type Slectionnez le type de message : topic ou queue. Ce champ nest pas disponible si vous slectionnez le serveur Websphere MQ dans la liste MQ Server.

Host/Port Username Password Message From

Guide de Rfrence des Composants Talend Open Studio

1297

Proprits du tMomInput

Message Body Type

Slectionnez le type de message : Text, Bytes ou Map.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma du composant tMomInput est en lecture seule. Il est compos de deux colonnes : From et Message. Websphere MQ uni- Channel quement Queue Manager Message Queue La valeur par dfaut est DC.SVRCONN. Renseignez le gestionnaire de file(s) dattente. Saisissez le nom de la file dattente.

Is using message id to Cochez cette case pour appliquer un filtre portant sur fetch les messages id, filtre que vous dterminerez dans le champ Message id. Commit (delete mes- Cochez cette case afin de forcer le commit aprs lecture sage after reading from de chaque message dans la file dattente. the queue) Backout removed mes- Cochez cette case pour indiquer au gestionnaire de file sages que tous les messages lus depuis le serveur ne seront pas supprims lorsque la connexion au serveur sera suspendue. Cette case ainsi que la case Browse message dans la vue Advanced settings vous permettent de lire des messages de manire non destructive dans la file. Elle n'est visible que lorsque la case Keep listening est dcoche. Pour plus d'informations, consultez la page 144 du Guide MQSeries Using Java [https://publib.boulder.ibm.com/ iseries/v5r2/ic2924/books/csqzaw07.pdf] (en anglais). ActiveMQ uniquement Receive number of mes- Cochez cette case afin de limiter le nombre de messages sages recevoir dans la console. Lorsque vous choisissez de limiter le nombre de messages recevoir, la limite de temps devient inactive, les champs Keep listening / Sleeping time (in sec) disparaissent. Advanced settings Browse message Cochez cette case afin de dsactiver les options Commit (delete message after reading from the queue) et Backout removed messages dans la vue Basic settings et d'ouvrir la file pour parcourir les messages. Cette case ainsi que la case Backout removed messages dans la vue Basic settings vous permettent de lire des messages de manire non destructive dans la file. La case Browse message est visible uniquement lorsque la case Backout removed messages est dcoche. Pour plus d'informations, consultez MQC: MQOO_BROWSE [http:// publib.boulder.ibm.com/ infocenter/wmqv7/v7r0m0/index.jsp?

1298

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMomInput

topic=%2Fcom.ibm.mq.java.doc%2Fcom %2Fibm%2Fmq%2FMQC.html/] (en anglais). Get MQMD Fields Cochez cette case pour dfinir un ou plusieurs Message Descriptor(s) en ajoutant de nouveaux champs pour MQMD (Message queuing message descriptor) dans le tableau Parameter : Field Name : slectionnez un ou plusieurs descripteur(s) de messages dans la liste afin de rcuprer les informations de l'en-tte du message. Reference Column Name : Informations d'en-tte et proprits du message. Pour plus d'informations, consultez Fields for MQMD [http://publib.boulder.ibm.com/infocenter/wmqv7/v7r0m0/index.jsp? topic=%2Fcom.ibm.mq.csqzak.doc %2Ffr13040_.htm/] (en anglais). tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Enable parallel execu- Cocher cette case permet de traiter plusieurs flux de tion donnes simultanment. Cela permet de traiter les donnes plus rapidement. Dans le champ Number of parallel executions, vous pouvez : - Saisir le nombre dexcutions parallles dsir - Appuyer sur Ctrl+Espace et slectionner la variable de contexte dans la liste. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio. Les actions sur la table (Action on table) ne sont pas disponibles avec la fonction de paralllisation. Ainsi, pour crer une table, vous devez utiliser un composant tCreateTable. Lorsque lexcution parallle est active, il nest pas possible dutiliser les variables globales pour retrouver les valeurs de retour dans un sous-job. Utilisation Limitation Ce composant est gnralement utilis en tant que composant de dbut. Il requiert un composant de sortie. Assurez-vous que le serveur Websphere, JBoss ou ActiveMQ correspondant est lanc.

Guide de Rfrence des Composants Talend Open Studio

1299

Scnario : Communication asynchrone via un serveur MOM

Scnario : Communication asynchrone via un serveur MOM


Ce scnario est compos de deux Jobs. Le premier permet de poster des messages sur la file dattente du serveur JBoss et le deuxime rcupre les messages de ce serveur. Dans le premier Job, un message compos de chanes de caractres est cr laide du composant tRowGenerator puis transmis au serveur JBoss laide du composant tMomOutput. Un composant intermdiaire, le composant tLogRow, permet dafficher le flux transmis.

Cliquez et dposez ces trois composants dans votre premier Job et connectez-les via le clic-droit avec des liens de type Main row. Double-cliquez sur le composant tRowGenerator pour configurer le schma des donnes qui seront gnres de manire alatoire.

Crez une seule colonne appele message. Elle correspond au message qui sera mis sur la file dattente du MOM. Cette colonne est de type String et peut contenir une valeur nulle. Pour produire les donnes, utilisez une fonction prdfinie permettant de concatner de manire alatoire les caractres ascii choisis pour former la chane de 6 caractres. Cette fonction est la suivante : getAsciiRandomString. (version Java). Cliquez sur le bouton daperu pour afficher un chantillon au hasard des donnes gnres. Paramtrez le champ Number of rows to be generated permettant de dfinir le nombre de lignes gnre 10. Cliquez sur OK pour valider. Le composant tLogRow est uniquement utilis pour afficher un tat intermdiaire des donnes manipules. Dans cet exemple, aucune configuration spcifique nest ncessaire. Puis slectionnez le composant tMomOutput.

Dans cet exemple, le serveur MQ server utiliser est de type JBoss. Dans les champs Host et Port, renseignez les informations de connexion correspondantes.

1300

Guide de Rfrence des Composants Talend Open Studio

Scnario : Communication asynchrone via un serveur MOM

Slectionnez le type de message dans la liste droulante Message type, il peut tre de type Queue ou Topic. Pour cet exemple, slectionnez le type Queue dans la liste. Dans le champ To, saisissez les informations source du message strictement telles quelles sont attendues par le serveur. Il doit correspondre au type de message que vous avez slectionn dans la liste droulante Message Type, notamment : queue/A. Le nom du message est sensible la casse, ainsi queue/A et Queue/A sont diffrents. Puis cliquez sur Sync Columns pour rcuprer le schma du composant prcdent. Le schma tant en lecture seule, il ne peut tre modifi. Les donnes envoyes sur le serveur MQ proviennent de la premire colonne rencontre du schma. Excutez le Job et, grce au composant tLogRow, observez dans la console le flux de donnes transmis.

Puis paramtrez le deuxime Job pour rcuprer les messages de la file dattente du serveur MOM.

Cliquez et dposez un composant tMomInput (dans la famille Internet de la Palette) et un composant tLogRow pour afficher les messages rcuprs. Slectionnez le tMomInput et dfinissez ses paramtres.

Slectionnez le serveur MQ server dans la liste. Dans cet exemple, un serveur de message JBoss est utilis. Renseignez les informations Host et Port du serveur. Renseignez les paramtres des champs Message From et Message Type afin quils correspondent la source et au type de message attendus par le serveur de message. Le schma dans le champ Schema est en lecture seule et est compos de deux colonnes : From et Message. Cochez la case Keep listening et paramtrez la frquence de vrification 5 secondes. Lorsque vous utilisez loption Keep Listening, vous devez cliquez sur le bouton Kill pour stopper le Job. Laissez les paramtres par dfaut du composant tLogRow.

Guide de Rfrence des Composants Talend Open Studio

1301

Scnario : Communication asynchrone via un serveur MOM

Enregistrez le Job et excutez-le (si vous le lancez pour la premire fois ou si vous lavez stopper au cours dun lancement prcdent).

Les messages rcuprs sur le serveur sont affichs dans la console.

1302

Guide de Rfrence des Composants Talend Open Studio

tMomMessageIdList

tMomMessageIdList

Proprits du tMomMessageIdList
Famille du composant Fonction Internet Le composant tMomMessageIdList rcupre la liste des ID des messages partir de la file dattente dun systme Middleware orient Message et la passe au composant suivant. Le tMomMessageIdList permet ditrer les ID de certains messages. Il est gnralement utilis avec le tMomInput. Pour plus dinformations, consultez la section intitule tMomInput . MQ Server Slectionnez dans cette liste le serveur MOM utiliser. Les paramtres requis diffrent lgrement en fonction du serveur slectionn. Renseignez le nom de lhte (Host) et ladresse IP du serveur MOM ainsi que le Port. La valeur par dfaut est Channel. Renseignez le gestionnaire de file(s) dattente. Saisissez le nom de la file dattente.

Objectif

Basic settings

Host/Port Websphere Channel Queue Manager Message Queue Utilisation Limitation

Ce composant est gnralement utilis en tant que composant de dbut. Il requiert un composant de sortie. Assurez-vous que le serveur Websphere correspondant est lanc.

Scnario associ
Pour un scnario associ, consultez la section intitule tMomInput .

Guide de Rfrence des Composants Talend Open Studio

1303

tMomOutput

tMomOutput

Proprits du tMomOutput
Famille de composant Fonction Objectif Basic settings Internet Dpose un message sur la file dattente dun systme Middleware orient message afin quil soit rcupr de manire asynchrone. Le tMomOutput permet de mettre en place des communications asynchrones via un serveur MOM. MQ Server Slectionnez dans la liste le serveur MOM utiliser. En fonction du serveur slectionn, les paramtres diffrent lgrement. Renseignez le nom de lhte ou ladresse IP du serveur MOM dans le champ Host, ainsi que le Port. Identifiant de connexion au serveur. Mot de passe de connexion au serveur.

Host/Port Username Password

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Lors de lutilisation du composant tMomOutput, le schma est en lecture seule mais changera en fonction du schma dentre. Le serveur attend uniquement un schma une colonne pour contenir les Messages. Websphere Channel Message Body Type Queue Manager Message Queue La valeur par dfaut est Channel. Slectionnez le type de message : Text, Bytes ou Map. Renseignez le gestionnaire de file(s) dattente. Saisissez le nom de la file dattente.

Is using message id to Cochez cette case pour paramtrer les messages selon set leur ID. JBoss Messaging To Saisissez la destination du message, telle quelle est attendue par le serveur ; le type est le nom du dossier cible doivent tre indiqus, par exemple : queue/A ou topic/testtopic Notez que ce champ est sensible la casse. Message Type Message Body Type ActiveMQ To Slectionnez le type de message : topic ou queue. Slectionnez le type de message : Text, Bytes ou Map. Saisissez la destination du message, telle quelle est attendue par le serveur ; le type est le nom du dossier cible doivent tre indiqus, par exemple : queue/A ou topic/testtopic Notez que ce champ est sensible la casse. Message Type Slectionnez le type de message : topic ou queue.

1304

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Message Body Type Utilisation Limitation

Slectionnez le type de message : Text, Bytes ou Map.

Ce composant ncessite un composant dentre ou un composant intermdiaire. Assurez-vous que le serveur Websphere, JBoss ou ActiveMQ correspondant est bien lanc.

Scnario associ
Pour un exemple dutilisation du tMomOutput, consultez la section intitule tMomInput

Guide de Rfrence des Composants Talend Open Studio

1305

tMomRollback

tMomRollback

Proprits du tMomRollback
Ce composant est troitement li au composant tMomCommit. Ils sont gnralement utiliss ensemble lors de transactions. Famille de composant Fonction Objectif Basic settings Internet Le tMomRollback annule la transaction sur le serveur MQ. Ce composant vite le commit de transaction involontaire. Component list MQ Server Close Connection Advanced settings Utilisation Limitation tStatCatcher Statistics Slectionnez dans la liste le composant de connexion du Job en cours. Slectionnez dans cette liste le serveur MOM utiliser. Dcochez cette case pour continuer utiliser la connexion une fois que le composant a excut sa tche. Cochez cette case pour collecter les donnes de log au niveau du composant.

Il faut utiliser ce composant en association avec des composants Mom, notamment avec le tMomCommit. n/a

Scnario associ
Pour un scnario associ au tMomRollback, consultez la section intitule Scnario : Annuler linsertion de donnes dans des tables mre/fille du composant tMysqlRollback.

1306

Guide de Rfrence des Composants Talend Open Studio

tPOP

tPOP

Proprits du tPOP
Famille du composant Fonction Objectif Internet Le composant tPOP rcupre un ou plusieurs e-mails partir dun protocole POP3 ou IMAP. Le composant tPOP utilise le protocole POP ou IMAP pour se connecter au serveur de messagerie spcifi. Il rcupre ensuite un ou plusieurs e-mails et crit les informations rcupres dans un ou plusieurs fichiers dfinis. Les paramtres avancs (Advanced settings) permettent d'appliquer un ou plusieurs filtres la slection. Host Port Renseignez le nom de lhte ou ladresse IP du serveur de messagerie auquel vous voulez vous connecter. Renseignez le numro du port du serveur de messagerie.

Basic settings

Username et Password Renseignez les informations dauthentification votre compte de messagerie : Username : entrez lidentifiant que vous utilisez pour accder votre bote mail. Password : entrez le mot de passe de connexion votre bote mail. Output directory Renseignez le chemin daccs au dossier dans lequel vous voulez stocker les e-mails rcuprs partir de votre messagerie, ou cliquez sur [...] pour parcourir vos dossiers jusqu lemplacement souhait. Appuyez sur Ctrl+Espace pour afficher la liste des modles prdfinis ou dfinissez manuellement la syntaxe du nom des fichiers cible. Les donnes des e-mails rcuprs partir du serveur de messagerie sont crites dans ces fichiers. Par dfaut, tous les messages prsents sur le serveur de messagerie spcifi sont rcuprs. Pour ne rcuprer qu'un nombre dfini de messages, dcochez cette case et renseignez dans le champ Number of emails to retrieve : le nombre de-mails rcuprer. La collecte des e-mails se fait du plus rcent au plus ancien. Delete emails from ser- Cochez cette case si vous ne souhaitez pas conserver ver sur le serveur les e-mails rcuprs. Pour les serveurs Gmail, cette option ne fonctionne pas avec le protocole POP3. Slectionnez le protocole IMAP et vrifiez que le

Filename pattern

Retrieve all emails?

Guide de Rfrence des Composants Talend Open Studio

1307

Proprits du tPOP

compte Gmail est configur pour utiliser ce protocole. Choose the protocol Slectionnez partir de la liste droulante le protocole utiliser pour rcuprer les e-mails. Le protocole dpend de celui utilis par votre messagerie. Si vous choisissez le protocole imap, vous aurez la possibilit de spcifier le dossier contenant les e-mails que vous souhaitez rcuprer. Cochez cette case si votre serveur de messagerie utilise ce protocole de scurisation des changes. Cette option est obligatoire pour les utilisateurs de messagerie Gmail. Advanced settings tStatCatcher Statistics Filter Cochez cette case pour collecter les donnes de log au niveau du composant. Cliquez sur le bouton [+] pour ajouter des lignes de filtre afin de ne rcuprer quune slection de-mails : Filter item : slectionnez lun des types de filtre suivants partir de la liste droulante : From : les messages sont filtrs en fonction de ladresse e-mail de provenance. To : les messages sont filtrs en fonction de ladresse e-mail de destination. Subject : les messages sont filtrs en fonction du sujet. Before date : les messages sont filtrs en fonction de la date dmission ou de rception ; ils doivent tre antrieurs la date indique. After date : les messages sont filtrs en fonction de la date dmission ou de rception ; ils doivent tre postrieurs la date indique. Pattern : appuyez sur Ctrl+Espace pour afficher la liste des valeurs disponibles et slectionnez la valeur utiliser pour chacun des filtres. Filter condition relation Slectionnez le type de relation appliquer entre les filtres : and : les conditions dtermines par les filtres sajoutent les unes aux autres, la recherche est plus restrictive. or : les conditions dtermines par les filtres sont indpendantes les unes des autres, la recherche est plus large. Utilisation Limitation Ce composant ne traite pas de flux de donnes, il peut donc tre utilis seul. n/a

Use SSL

1308

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer une slection de-mails partir dun compte de messagerie

Scnario : Rcuprer une slection de-mails partir dun compte de messagerie


Ce scnario Java un seul composant a pour but de rcuprer un nombre prdfini de-mails partir dun compte de messagerie. A partir de la Palette, cliquez-dposez un composant tPOP dans lditeur graphique, Double-cliquez sur le tPOP pour afficher la vue Basic settings et paramtrer le composant. Renseignez les informations de connexion au serveur de messagerie : le nom de lhte ou son adresse IP entre guillemets dans le champ Host et le numro de port dans le champ Port. Saisissez ensuite les informations d'authentification de votre compte de messagerie. Dans le champ Username, saisissez entre guillemets votre identifiant et dans le champ Password, saisissez votre mot de passe. Dans cet exemple, le serveur de messagerie s'appelle Free.

Dans le champ Output directory, slectionnez manuellement le chemin daccs ou cliquez sur [...] pour slectionner le dossier de destination des e-mails rcuprs sur le serveur. Dans le champ Filename pattern, dfinissez la syntaxe de nommage des fichiers de destination ou appuyez sur Ctrl+Espace pour afficher la liste des modles prdfinis. Dans cet exemple, la syntaxe est la suivante : TalendDate.getDate("yyyyMMdd-hhmmss") + "_" + (counter_tPOP_1 + 1) + ".txt" Les fichiers de destination, enregistrs au format texte, sont dfinis par leur date, heure et ordre de collecte. Dcochez la case Retrieve all emails? pour ne rcuprer quun nombre dfini de-mails. Dans cet exemple, 10 messages sont rcuprs. Cochez la case Delete emails from server pour supprimer les e-mails du serveur une fois quils ont t rcuprs en local. Slectionnez un type de protocole partir de la liste droulante Choose the protocol. Le choix du protocole dpend de celui utilis par votre fournisseur de messagerie. Certains fournisseurs comme Gmail utilisent les deux protocoles. Dans cet exemple, le protocole slectionn est pop3. Enregistrez le Job puis appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

1309

Scnario : Rcuprer une slection de-mails partir dun compte de messagerie

Le composant tPOP a ainsi rcupr les 10 derniers messages du compte de messagerie spcifi. Pour chaque e-mail rcupr, un fichier .txt a t cr dans le dossier tPOP. Chaque fichier contient les mtadonnes d'envoi du message (expditeur, destinataire, objet du message) ainsi que les donnes propres au message.

1310

Guide de Rfrence des Composants Talend Open Studio

tREST

tREST

Proprits du tREST
Famille du composant Fonction Internet Le composant tREST envoie des requtes HTTP un fournisseur de services Web REpresentational State Transfer (REST) et obtient les rponses correspondantes. Le composant tREST sert de client dun service Web REST. Il envoie des requtes HTTP un fournisseur de services Web et obtient les rponses correspondantes. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le composant tREST utilise toujours un schma local (built-in) en lecture seule qui contient deux colonnes : - Body : stocke les rsultats provenant du serveur - ERROR_CODE : stocke le code de statut HTTP lorsquune erreur survient pendant le processus dinvocation. Le sens spcifique des codes derreur est soumis aux dfinitions de votre fournisseur de services Web. Pour plus dinformations, consultez en.wikipedia.org/ wiki/List_of_HTTP_status_codes [http:// en.wikipedia.org/wiki/List_of_HTTP_status_codes]. (en anglais). Cliquez sur Edit Schema pour visualiser le schma. Modifier le schma peut engendrer une perte de la structure du schma et donc un chec du composant. URL HTTP Method Renseignez ladresse URL du serveur Web REST invoquer. A partir de cette liste, slectionnez une mthode HTTP qui dcrit laction souhaite. Le sens spcifique des mthodes HTTP est soumis aux dfinitions de votre fournisseur de services Web. Ci-dessous, les dfinitions des mthodes HTTP gnralement admises : - GET : rcupre les donnes du ct serveur en fonction des paramtres donns. - POST : cre et tlcharge les donnes en fonction des paramtres donns.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1311

Scnario : Crer et rcuprer des donnes en invoquant un service Web REST

- PUT : met jour les donnes en fonction des paramtres donns, ou cre les donnes si elles sont inexistantes. - DELETE : supprime les donnes en fonction des paramtres donns. HTTP Headers Saisissez les paires nom/valeur (name/value) pour les en-ttes HTTP afin de dfinir les paramtres de lopration HTTP demande. Pour connatre les dfinitions spcifiques den-ttes HTTP, consultez votre fournisseur de services Web REST. Pour plus dinformations, consultez http:// en.wikipedia.org/wiki/List_of_HTTP_headers. (en anglais). HTTP Body Saisissez les donnes utiles (payload) charger du ct serveur lorsque les actions POST ou PUT sont slectionnes. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant..

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant est utilis comme client dun service Web REST afin de communiquer avec un fournisseur de services Web REST. Il requiert un composant de sortie. Lexcution de JRE 1.6 est requise pour faire fonctionner ce composant.

Limitation

Scnario : Crer et rcuprer des donnes en invoquant un service Web REST


Ce scnario dcrit un Job simple qui invoque un service Web REST afin de crer un nouvel enregistrement client du ct serveur et de rcuprer les informations du client. Une fois excut, ce Job affiche les informations correspondantes dans la console de la vue Run. A partir de la Palette, cliquez-dposez les composants suivants dans lespace de modlisation graphique : deux composants tREST et deux composants tLogRow. Renommez les deux composants tREST afin quils dcrivent au mieux les actions effectuer. Connectez chaque composant tREST un tLogRow laide dune connexion de type Row > Main. Connectez le premier composant tREST au second tREST laide dune connexion de type Trigger > OnSubjobOK.

1312

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer et rcuprer des donnes en invoquant un service Web REST

Double-cliquez sur le premier composant tREST afin dafficher longlet Basic settings de sa vue Component.

Renseignez le champ URL avec ladresse URL du serveur Web que vous tes sur le point dinvoquer. Notez que ladresse URL fournie dans ce scnario est destine essentiellement la dmonstration, ce nest pas une adresse valide. A partir de la liste HTTP Method, slectionnez POST afin denvoyer une requte HTTP permettant de crer un nouvel enregistrement. Cliquez sur le bouton [+] afin dajouter une ligne au tableau HTTP Headers, et saisissez la paire nom-valeur (name-value) adquate, soumise aux dfinitions de votre fournisseur de service, en indiquant le type de mdia des donnes utiles (payload) envoyer du ct serveur. Dans ce scnario, saisissez Content-Type et application/xml. Pour plus dinformations concernant les types de mdia Internet, consultez http://www.w3.org/Protocols/rfc2616/rfc2616-sec3.html#sec3.7. (en anglais). Saisissez dans le champ HTTP Body les donnes utiles (payload) charger du ct serveur, savoir <Customer><name>Steven</name></Customer> dans ce scnario, pour crer un enregistrement dun nouvel utilisateur appel Steven. Si vous souhaitez inclure des guillemets double dans votre payload, assurez-vous dutiliser un caractre dchappement, la barre oblique inverse, avant chaque guillemet. Dans ce scnario par exemple, saisissez <Customer><name>\"Steven\"</name></Customer> si vous souhaitez mettre le prnom Steven entre guillemets double. Double-cliquez sur le second tREST afin dafficher longlet Basic settings de sa vue Component. Renseignez le champ URL avec la mme adresse URL que celle utilise dans le premier composant tREST. A partir de la liste HTTP Method, slectionnez GET afin denvoyer une requte HTTP permettant de rcuprer tous les enregistrements existants. Dans longlet Basic settings de la vue Component de chaque tLogRow, cochez la case Print component unique name in front of each output row (Afficher le nom unique du composant en face de chaque ligne de sortie) pour identifier au mieux les deux flux de sortie.

Guide de Rfrence des Composants Talend Open Studio

1313

Scnario : Crer et rcuprer des donnes en invoquant un service Web REST

Sauvegardez votre Job et appuyez sur F6 pour lexcuter. La console indique que le premier composant tREST envoie une requte HTTP ct serveur afin de crer un nouvel utilisateur appel Steven et que le second composant tREST lit avec succs les donnes ct serveur comprenant les informations de lutilisateur nouvellement cr.

1314

Guide de Rfrence des Composants Talend Open Studio

tRSSInput

tRSSInput

Proprits du tRSSInput
Famille du composant Fonction Objectif Internet Le composant tRSSInput lit des flux RSS en utilisant des URLs. Le tRSSInput permet de suivre les billets posts sur certains sites en particulier afin den rassembler et organiser les informations rapidement et facilement pour votre utilisation. Schema type et Edit Un schma est une description de lignes, i.e., il dfinit Schema le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Dans le contexte dutilisation du tRSSInput, le schma est compos de quatre colonnes : TITLE, DESCRIPTION, PUBDATE et Link. Les paramtres de titre sont en lecture seule, contrairement leur type et leur longueur. RSS URL Read articles from Saisissez lURL du flux RSS lire. Lorsque cette case est coche, le composant tRSSInput lit les articles du flux RSS partir de la date renseigne en cliquant sur le bouton [...] situ ct du champ date time.

Basic settings

Max number of articles Lorsque cette case est coche, le composant tRSSInput lit autant darticles que le nombre spcifi dans le champ max amount. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et les lignes contenant les erreurs seront ignores.

Utilisation Limitation

Ce composant est gnralement utilis en tant que composant de dbut. Il requiert un composant de sortie. n/a.

Scnario : Rcuprer les billets frquemment mis jour sur un blog


Ce scnario Java deux composants a pour but de rcuprer les billets qui sont souvent mis jour sur un blog, partir dun flux RSS local Talend, en utilisant le composant tRSSInput. A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : le tRSSInput et le tLogRow.

Guide de Rfrence des Composants Talend Open Studio

1315

Scnario : Rcuprer les billets frquemment mis jour sur un blog

Cliquez-droit sur le premier pour le connecter au second laide dun lien de type Row Main.

Dans lditeur graphique, slectionnez le tRSSInput. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tRSSInput.

Configurez le champ Schema Type en mode Built-In puis cliquez sur le bouton [...] situ ct du champ Edit Schema pour changer le type et la longueur des paramtres du schma si ncessaire. Cliquez sur OK pour fermer la bote de dialogue.

Le schma du tRSSInput est compos de quatre colonnes, TITLE, Description, PUBDATE, et LINK. Il est en lecture seule, except pour les paramtres de type et de longueur. Dans longlet Basic settings du composant tRSSInput, saisissez lURL daccs au flux RSS. Dans ce scnario, le tRSSInput est associ au flux RSS Talend : http://feeds.feedburner.com/Talend. Cochez/dcochez les autres cases selon vos besoins. Dans ce scnario, on veut afficher les informations de deux articles dats du 20 juillet 2008. Dans lespace graphique, slectionnez le tLogRow puis cliquez sur la vue Component pour en dfinir la configuration de base. Pour plus dinformations sur les proprits du composant tLogRow, consultez la section intitule Proprits du tLogRow . Enregistrez le Job puis appuyez sur F6 pour lexcuter.

1316

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer les billets frquemment mis jour sur un blog

Le composant tRSSInput a accd au flux RSS du site de Talend votre place et en a organis les informations pour vous. Deux billets sont affichs sur la console. Chacun deux a ses propres titre, description, date de publication et URL du flux RSS correspondante. Les blogs prsentent le dernier billet en premier et vous pouvez faire dfiler vers le bas pour lire les billets les plus anciens.

Guide de Rfrence des Composants Talend Open Studio

1317

tRSSOutput

tRSSOutput

Proprits du tRSSOutput
Famille du composant Fonction Objectif Basic settings Internet Le composant tRSSOutput crit des fichiersXML RSS_Feed ou Atom_Feed. Le tRSSOutput permet de crer des fichiers XML contenant des flux RSS ou Atom. File Name Chemin daccs ou nom du fichier XML en sortie. Consultez galement leGuide Utilisateur de Talend Open Studio. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette option pour ajouter des nouvelles lignes la fin du fichier. Slectionnez RSS ou ATOM selon le flux que vous souhaitez gnrer. Les informations renseigner dans cette zone concernent lintgralit des donnes saisies, du site, etc. plutt que des lments particuliers. Title : Saisissez un titre significatif. Description : Entrez une description du contenu qui vous semble suffisamment dtaille. Publication date : Renseignez la date adquate. Link : Saisissez lURL approprie. Feed (en mode ATOM) Title : Saisissez un titre significatif. Link : Saisissez lURL approprie. Id : Saisissez lURL valide correspondant au champ Link. Update date : Saisissez la date de mise jour. Author name : Saisissez le nom de lauteur. Optionnal Channel Ele- Renseignez dans le tableau les informations relatives ments aux mtadonnes du flux RSS. Cliquez sur le bouton [+] pour ajouter de nouvelles lignes : Element Name : nom de la mtadonne. Element Value : contenu de la mtadonne.

Encoding

Append Mode Channel (en mode RSS)

1318

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Crer un flux RSS et stocker les fichiers sur un serveur FTP

Schema type et Edit Un schma est une description de lignes, i.e., il dfinit schema le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Dans le contexte dutilisation du tRSSInput, le schma est compos de quatre colonnes : TITLE, DESCRIPTION, PUBDATE et Link. Les paramtres de titre sont en lecture seule, contrairement leur type et leur longueur. Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant doit obligatoirement tre reli un composant de dbut ou un composant intermdiaire. n/a

Scnario 1 : Crer un flux RSS et stocker les fichiers sur un serveur FTP
Ce scnario Java a pour but de : crer un flux RSS pour des fichiers que vous souhaitez partager avec dautres personnes, et stocker lensemble des fichiers sur un serveur FTP. Ce scnario permet dcrire un fichier XML de flux RSS partir dune table MySQL contenant des informations concernant des livres. Il ajoute galement des liens vers les fichiers stocks sur un serveur FTP au cas o les utilisateurs voudraient avoir accs aux fichiers dans leur intgralit. A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : le tMysqlInput, le tRSSOutput et le tFTPPut. Cliquez droit sur le tMysqlInput et connectez-le au tRSSOutput laide dun lien de type Row Main. Cliquez droit sur le tMysqlInput et connectez-le au tFTPPut laide dun lien de type OnSubjobOk.

Dans lespace graphique, slectionnez le tMysqlInput. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tMysqlInput.

Guide de Rfrence des Composants Talend Open Studio

1319

Scnario 1 : Crer un flux RSS et stocker les fichiers sur un serveur FTP

Configurez le champ Property type en mode Repository puis cliquez sur le bouton [...] pour slectionner la base de donnes adquate dans la liste. Les dtails de connexion ainsi que le schma sont remplis automatiquement. Dans le champ Table Name, saisissez le nom de votre table ou cliquez sur le bouton [...] et slectionnez le nom de la table partir de la liste. Dans ce scnario, la table Mysql de donnes saisies sappelle rss_talend et le schma comporte quatre colonnes, TITLE, Description, PUBDATE, et LINK. Dans le champ Query, saisissez la requte de base de donnes en faisant particulirement attention ce que lordre des champs corresponde au schma dfini, ou cliquez sur Guess Query. Dans lespace graphique, slectionnez le composant tRSSOutput. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tRSSOutput.

1320

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Crer un flux RSS et stocker les fichiers sur un serveur FTP

Dans le champ File name, utilisez le nom de fichier et son chemin daccs dfinis par dfaut ou parcourez vos dossiers pour dfinir votre propre fichier XML de sortie. Slectionnez le type dencodage partir de la liste Encoding Type. Dans la zone Mode, slectionnez RSS. Dans le panneau Channel, saisissez un titre, une description, une date de publication et un lien dfinissant lensemble de vos donnes saisies. Slectionnez le type de schma dans la liste Schema Type puis cliquez sur Edit Schema pour le modifier si ncessaire. Vous pouvez galement cliquer sur Sync Column pour rcuprer le schma gnr par le composant prcdent. Enregistrez votre Job puis appuyez sur F6 pour en excuter la premire partie.

Le composant tRSSOutput a cr en sortie un flux RSS au format XML pour les fichiers dfinis. Pour stocker lintgralit des fichiers sur un serveur FTP : Dans lespace graphique, slectionnez le FTPPut. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFTPPut.

Guide de Rfrence des Composants Talend Open Studio

1321

Scnario 2 : Crer un flux RSS contenant des mtadonnes

Saisissez le nom du serveur et le numro de port dans les champs correspondants. Renseignez vos dtails de connexion dans les champs Username et Password. Parcourez vos dossier jusquau rpertoire local ou tapez manuellement le chemin daccs dans le champ Local directory. Entrez les dtails du serveur de rpertoire distant. Slectionnez le mode de transfert partir de la liste Transfer mode. Dans le panneau Files, cliquez sur le bouton [+] pour ajouter des lignes puis remplissez les masques de fichiers de tous les fichiers copier sur le rpertoire distant. Dans ce scnario, les fichiers enregistrer sur le serveur FTP sont tous des fichiers texte. Enregistrez votre Job puis appuyez sur F6 pour lexcuter. Les fichiers dfinis sont copis sur le serveur distant.

Scnario 2 : Crer un flux RSS contenant des mtadonnes


Ce scnario Java deux composants a pour but de crer un flux RSS contenant des mtadonnes et de rediriger les informations obtenues dans un fichier XML de flux RSS en sortie. A partir de la Palette, cliquez-dposez les composants tRSSInput et tRSSOutput dans lditeur graphique. Cliquez droit sur le tRSSInput et connectez-le au tRSSOutput laide dun lien de type Row Main.

Dans lespace graphique, slectionnez le tRSSInput. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tRSSInput.

1322

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Crer un flux RSS contenant des mtadonnes

Dfinissez le type du schma comme Built-In. Si votre schma est dj stock localement dans le Repository, slectionnez loption Repository dans le champ Schema, puis cliquez sur le bouton [...] ct du champ Edit Schema pour afficher une bote de dialogue dans lasquelle vous pouvez choisir les mtadonnes appropries. Pour plus dinformations concerenant les mtadonnes, consultez le Guide Utilisateur Talend Open Studio. Cliquez sur le bouton [...] situ ct du champ Edit Schema pour vrifier les paramtres du schma si ncessaire.

Le schma du tRSSInput est compos de quatre colonnes, TITLE, DESCRIPTION, PUBDATE, et LINK et il est en lecture seule. Cliquez sur OK pour fermer la bote de dialogue. Dans lespace graphique, double-cliquez sur le composant tRSSOutput pour ouvrir sa vue Component et dfinir sa configuration de base (Basic settings).

Guide de Rfrence des Composants Talend Open Studio

1323

Scnario 2 : Crer un flux RSS contenant des mtadonnes

Dans le champ File name, utilisez le nom de fichier de sortie et son chemin daccs dfinis par dfaut ou parcourez vos dossiers pour dfinir votre propre fichier XML de sortie. Slectionnez le type dencodage partir de la liste Encoding Type. Dans la zone Mode, slectionnez RSS. Dans le panneau Channel, saisissez un titre, une description, une date de publication et un lien dfinissant lensemble de vos donnes saisies. Dans le tableau Optional Channel Element, dfinissez les mtadonnes de votre flux RSS. Dans ce scnario, le flux comprend deux mtadonnes : copyright, laquelle est associe la valeur tos, et language, laquelle est associe la valeur en_us. Slectionnez le type de schma dans la liste Schema Type puis cliquez sur Edit Schema pour le modifier si ncessaire. Vous pouvez galement cliquer sur Sync Column pour rcuprer le schma gnr par le composant prcdent. Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

1324

Guide de Rfrence des Composants Talend Open Studio

Scnario 3 : Crer un fichier XML de flux ATOM

Les fichiers dfinis sont copis dans le fichier XML de sortie et les mtadonnes apparaissent sous le noeud <channel>, en dessous des informations de base du flux RSS.

Scnario 3 : Crer un fichier XML de flux ATOM


Ce scnario Java dcrit un Job deux composants, qui gnre des donnes et les crit dans un fichier XML de flux ATOM. Dposez les composants suivants de la Palette dans lespace de modlisation graphique : un tFixedFlowInput du groupe Misc et un tRSSOutput du groupe Internet. Cliquez-droit sur le tFixedFlowInput et connectez-le au tRSSOutput laide dun lien Row Main. Une fentre pop-up saffiche et vous demande si vous souhaitez passer le schma du tRSSOutput au tFixedFlowInput, cliquez sur Yes (Oui).

Dans lespace de modlisation graphique, double-cliquez sur le tFixedFlowInput afin dafficher sa vue Component et dfinir ses Basic settings.

Guide de Rfrence des Composants Talend Open Studio

1325

Scnario 3 : Crer un fichier XML de flux ATOM

Laissez le type de Schema en Built-in. Cliquez sur le bouton [...] ct du champ Edit schema pour afficher le schma import du composant de sortie. Dans le champ Number of rows, laissez le paramtre par dfaut, 1, pour ne gnrer quune ligne de donnes. Dans la zone Mode, laissez slectionne loption Use Single Table et remplissez le tableau Values. Notez que le champ Column du tableau Values est rempli par les colonnes du schma dfini dans le composant. Dans le champ Value du tableau Values, saisissez les donnes que vous souhaitez envoyer au composant suivant. Dans lespace de modlisation, double-cliquez sur le composant tRSSOutput afin dafficher sa vue Component et dfinir ses Basic settings.

1326

Guide de Rfrence des Composants Talend Open Studio

Scnario 3 : Crer un fichier XML de flux ATOM

Cliquez sur le bouton [...] ct du champ File Name afin de dfinir le rpertoire et le nom du fichier XML de sortie. Dans la zone Mode, slectionnez ATOM pour gnrer un fichier XML de flux ATOM. Dans la zone Feed, saisissez un titre, un lien, un ID, la date de mise jour, et le nom de lauteur, afin de dfinir vos donnes comme un tout. Slectionnez le type de votre schma, dans la liste Schema Type puis cliquez sur le bouton [...] du champ Edit Schema afin dafficher le schma et de le modifier si ncessaire.

Comme le format du flux ATOM est strict, des informations par dfaut sont requises afin de crer le fichier XML. Le schma du tRSSOutput comprend donc des colonnes par dfaut contenant ces informations. Ces colonnes par dfaut sont grises pour indiquer quelles ne doivent pas tre modifies. Si vous choisissez de modifier le schma du composant, le fichier XML ATOM cr ne sera pas valide.

Guide de Rfrence des Composants Talend Open Studio

1327

Scnario 3 : Crer un fichier XML de flux ATOM

Save your Job and press F6 to execute it.

Le composant tRSSOutput cre un flux de sortie ATOM au format XML.

1328

Guide de Rfrence des Composants Talend Open Studio

tSCPClose

tSCPClose

Proprits du tSCPClose
Famille de composant Fonction Objectif Basic settings Advanced settings Utilisation Limitation Internet/SCP Le composant tSCPClose ferme la connexion au protocole entirement crypt. Ce composant permet de fermer une connexion au protocole SCP. Component list tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tSCPConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Scnario associ
Ce composant est troitement li aux composants tSCPConnection et tSCPRollback. Il est gnralement utilis avec un composant tSCPConnection car il permet de fermer une connexion pour la transaction en cours. Pour un scnario associ au composant tSCPClose, consultez la section intitule tMysqlConnection .

Guide de Rfrence des Composants Talend Open Studio

1329

tSCPConnection

tSCPConnection

Proprits du tSCPConnection
Famille de composant Fonction Objectif Basic settings Internet/SCP Le composant tSCPConnection ouvre une connexion SCP afin deffectuer une transaction. Le tSCPConnection permet douvrir une connexion SCP afin deffectuer des transferts scuriss de fichiers en une seule transaction. Host Port Username Password Utilisation Limitation n/a Adresse IP du serveur SCP. Numro du port dcoute du serveur SCP. Login de connexion au serveur SCP. Mot de passe de connexion au serveur SCP.

Authentication method Mthode dauthentification au serveur SCP. Ce composant est gnralement utilis comme sous-Job un seul composant.

Scnarios associs
Pour un scnario associ, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant . Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant

1330

Guide de Rfrence des Composants Talend Open Studio

tSCPDelete

tSCPDelete

Proprits du tSCPDelete
Famille de composant Fonction Objectif Basic settings Internet/SCP Le composant tSCPDelete supprime les fichiers slectionns dun serveur distant par le biais dun protocole entirement crypt. Le tSCPDelete permet de supprimer un fichier dun serveur SCP donn. Host Port Username Password Filelist Utilisation Limitation Adresse IP du serveur SCP. Numro du port dcoute du serveur SCP. Login de connexion au serveur SCP. Mot de passe de connexion au serveur SCP. Nom ou chemin daccs du fichier supprimer.

Authentication method Mthode dauthentification au serveur SCP.

Ce composant est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis en association avec dautres composants. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant . Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant .

Guide de Rfrence des Composants Talend Open Studio

1331

tSCPFileExists

tSCPFileExists

Proprits du tSCPFileExists
Famille de composant Fonction Objectif Basic settings Internet/SCP Le composant tSCPFileExists vrifie si un fichier est prsent sur le serveur distant, par le biais dun protocole entirement crypt. Le tSCPFileExists permet de vrifier la prsence dun fichier sur le serveur SCP spcifi. Host Port Username Password Remote directory Filename Utilisation Limitation Adresse IP du serveur SCP. Numro du port dcoute du serveur SCP. Login de connexion au serveur SCP. Mot de passe de connexion au serveur SCP. Chemin daccs au rpertoire du serveur distant. Nom du fichier chercher.

Authentication method Mthode dauthentification au serveur SCP.

Ce composant est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis en association avec dautres composants. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant . Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant .

1332

Guide de Rfrence des Composants Talend Open Studio

tSCPFileList

tSCPFileList

Proprits du tSCPFileList
Famille de composant Fonction Objectif Basic settings Internet/SCP Le composant tSCPFileList fait une opration ditration sur les fichiers dun rpertoire du serveur distant, par le biais dun protocole entirement crypt. Le tSCPFileList permet de lister les fichiers dun serveur SCP spcifi. Host Port Username Password Command separator Filelist Utilisation Limitation Adresse IP du serveur SCP. Numro du port dcoute du serveur SCP. Login de connexion au serveur SCP. Mot de passe de connexion au serveur SCP. Le caractre utilis pour sparer les diffrentes commandes. Nom ou chemin daccs au rpertoire contenant les fichiers lister.

Authentication method Mthode dauthentification au serveur SCP.

Ce composant est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis en association avec dautres composants. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant . Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant .

Guide de Rfrence des Composants Talend Open Studio

1333

tSCPGet

tSCPGet

Proprits du tSCPGet
Famille de composant Fonction Objectif Basic settings Internet/SCP Le composant tSCPGet transfre les fichiers slectionns par le biais dun protocole entirement crypt via une connexion SCP. Le tSCPGet permet de copier de fichiers du serveur SCP spcifi. Host Port Username Password Local directory Overwrite or Append Filelist Utilisation Limitation Adresse IP du serveur SCP. Numro du port dcoute du serveur SCP. Login de connexion au serveur SCP. Mot de passe de connexion au serveur SCP. Chemin daccs du rpertoire de destination. Liste des options disponibles pour le transfert des fichiers. Nom ou chemin daccs du ou des fichier(s) copier.

Authentication method Mthode dauthentification au serveur SCP.

Ce composant est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis en association avec dautres composants. n/a

Scnario : Rcuprer des fichiers dun serveur SCP distant


Ce scnario Java cre un Job un seul composant qui rcupre le fichier slectionn dun serveur SCP distant. Cliquez et dposez le composant tSCPGet dans lditeur graphique. Dans lditeur graphique, slectionnez le tSCPGet et cliquez sur la vue Component pour paramtrer ses proprits de base.

1334

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer des fichiers dun serveur SCP distant

Dans le champ Host, renseignez ladresse IP du serveur SCP. Dans le champ Port ,renseignez le numro du port dcoute du serveur SCP. Dans les champs Username et Password, renseignez respectivement le login et le mot de passe de connexion au serveur SCP. Dans la liste Authentication method, slectionnez la mthode dauthentification approprie. Notez que les champs suivants changent en fonction de la mthode dauthentification slectionne. La mthode dauthentification Password est utilise dans ce scnario. Dans le champ Local directory, renseignez le chemin daccs au rpertoire dans lequel sera copi le fichier. Dans la liste Overwrite or Append, slectionnez laction effectuer. Dans la zone Filelist, cliquez sur le bouton [+] pour ajouter une ligne la liste Source et renseignez le chemin daccs au fichier sur le serveur SCP distant. Dans ce scnario, le fichier copier du serveur SCP distant sur le disque local sappelle backport.pl. Enregistrez le Job et appuyez sur F6 lexcuter. Le fichier du serveur distant est copi sur le disque local.

Guide de Rfrence des Composants Talend Open Studio

1335

tSCPPut

tSCPPut

Proprits du tSCPPut
Famille de composant Fonction Objectif Basic settings Internet/SCP Le composant tSCPPut copie les fichiers slectionns sur un serveur SCP distant par le biais dun protocole entirement crypt. Le tSCPPut permet de copier les fichiers dans le rpertoire dun serveur SCP distant. Host Port Username Password Remote directory Filelist Utilisation Limitation Adresse IP dun serveur SCP. Numro du port dcoute du serveur SCP. Login de connexion au serveur SCP. Mot de passe de connexion au serveur SCP. Chemin daccs au rpertoire de destination. Nom ou chemin daccs au(x) fichier(s) copier.

Authentication method Mthode dauthentification au serveur SCP.

Ce composant est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis en association avec dautres composants. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant . Pour un scnario associ utilisant un protocole diffrent, consultez la section intitule Scnario : Copier des fichiers sur un serveur FTP distant .

1336

Guide de Rfrence des Composants Talend Open Studio

tSCPRename

tSCPRename

Proprits du tSCPRename
Famille de composant Fonction Objectif Basic settings Internet/SCP Le composant tSCPRename renomme des fichiers sur un serveur SCP distant. Le tSCPRename permet de renommer un ou des fichier(s) sur le serveur SCP slectionn. Host Port Username Password File to rename Rename to Utilisation Limitation Adresse IP du serveur SCP. Numro du port dcoute du serveur SCP. Login de connexion au serveur SCP. Mot de passe de connexion au serveur SCP. Nom ou chemin daccs au fichier renommer. Saisissez le nouveau nom du fichier.

Authentication method Mthode dauthentification au serveur SCP.

Ce composant est gnralement utilis comme sous-Job un seul composant mais il peut aussi tre utilis en association avec dautres composants. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant .

Guide de Rfrence des Composants Talend Open Studio

1337

tSCPTruncate

tSCPTruncate

Proprits du tSCPRename
Famille de composant Fonction Objectif Basic settings Internet/SCP Le composant tSCPTruncate supprime toutes les donnes dun fichier via une connexion SCP. Le tSCPTruncate permet de supprimer les donnes dun ou plusieurs fichier(s) dun serveur SCP. Host Port Username Password Remote directory Filelist Utilisation Limitation Adresse IP du serveur SCP. Numro du port dcoute du serveur SCP. Login de connexion au serveur SCP. Mot de passe de connexion au serveur SCP. Chemin daccs au fichier de destination. Nom ou chemin daccs au(x) fichier(s) vider.

Authentication method Mthode dauthentification au serveur SCP.

Ce composant est gnralement utilis en tant que sous-Job un seul composant mais il peut aussi tre utilis en association avec dautres composants. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Rcuprer des fichiers dun serveur SCP distant .

1338

Guide de Rfrence des Composants Talend Open Studio

tSendMail

tSendMail

Proprits du tSendMail
Famille de composant Fonction Objectif Basic settings Internet Le composant tSendMail envoie des messages et toute autre pice jointe aux destinataires spcifis. Le tSendMail permet de prvenir des destinataires dun tat particulier dun Job ou de possibles erreurs. To From Show senders name? Adresse e-mail du destinataire principal. Adresse e-mail du serveur d'envoi. Cochez cette case pour dfinir le nom dexpditeur afficher dans les messages. Sendername : renseignez le nom de lexpditeur. Cc Bcc Subject Message Adresse e-mail des destinataires en copie. Adresse e-mail des destinataires en copie cache. Objet du mail. Contenu du message. Appuyez sur Ctrl+Espace pour afficher la liste des variables disponibles.

Die if the attachment Dcochez cette case pour que les messages soient enfile doesnt exist voys mme si aucune pice jointe nest attache. Attachment / File and Cliquez sur le bouton [+] pour ajouter autant de lignes Content Transfer Enco- que ncessaire dans lesquelles vous pouvez ajouter des ding masques de fichier ou des chemins d'accs aux fichiers envoyer dans l'e-mail, s'il y en a. Deux options sont disponibles pour l'encodage du contenu transfrer : Default et Base64. Other Headers Cliquez sur le bouton [+] pour ajouter des lignes de filtre : Key : saisissez la cl de tout en-tte diffrent de len-tte standard. Value : saisissez la valeur correspondante la cl. SMTP Host et Port SSL Support STARTTLS Support Importance Adresse IP du serveur SMTP utilis pour lenvoi demails. Cochez cette case pour authentifier le serveur auprs du client via un protocole scuris SSL. Cochez cette case pour authentifier le serveur auprs du client via un protocole scuris STARTTLS. Slectionnez dans la liste droulante le niveau de priorit de votre message.

Guide de Rfrence des Composants Talend Open Studio

1339

Scnario : Envoyer un e-mail lors dune erreur

Need authentication?

Cochez la case dauthentification et renseignez le nom de lutilisateur (username) et son mot de passe (password), si cela est ncessaire pour accder au service. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et les lignes contenant les erreurs seront ignores.

Die on error

Advanced settings

MIME subtype from the Slectionnez dans la liste droulante la forme attribuer text MIME type au texte du message. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes. Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

tStatCatcher Statistics Utilisation

Ce composant est gnralement utilis en tant que sous-Job mais peut aussi tre utilis comme composant de sortie ou de fin de Job. Il peut tre connect aux autres composants via des liens Row ou Iterate. n/a

Limitation

Scnario : Envoyer un e-mail lors dune erreur


Ce scnario est un Job compos de trois composants permettant denvoyer un e-mail des destinataires spcifiques lorsquune erreur se produit.

A partir de la Palette, cliquez-dposez les composants suivants dans lespace de modlisation : tFileInputDelimited, tFileOutputXML et tSendMail. Cliquez-droit sur le composant tFileInputDelimited et reliez-le au composant tFileOutputXML laide dun lien de type Row > Main. Cliquez-droit sur le composant tFileInputDelimited et reliez-le au composant tSendMail laide dun lien de type Trigger > OnSubjobError. Double-cliquez sur le composant tFileInputDelimited pour afficher longlet Basic settings du composant et configurer ses paramtres de base.

1340

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoyer un e-mail lors dune erreur

A partir de la liste Property type, slectionnez : -Repository si vous avez dj stock les mtadonnes de votre fichier dentre dans le Repository, les champs suivants sont alors renseigns automatiquement avec les informations stockes, ou -Built-in si aucune mtadonne nest stocke pour votre fichier dentre ; vous devez alors renseigner manuellement les champs suivants. Dans cet exemple, cest le mode Built-in qui est utilis. Dans le champ File Name, renseignez le chemin daccs ou cliquez sur le bouton [...] pour parcourir vos dossiers jusquau fichier traiter. Ce champ est obligatoire. Dans cet exemple, le fichier traiter est customer_mail.csv. Dfinissez le sparateur de lignes dans le champ Row separator afin didentifier la fin dune ligne. Puis dfinissez le sparateur de champs dans Field separator pour dlimiter les champs composant une ligne. Les sparateurs utiliss dans ce scnario sont des sparateurs de champs et de lignes classiques de fichier CSV. Dans ce scnario, len-tte (Header), le pied de page (Footer) et la limite de lignes lues (Limit) nont pas besoin dtre dfinis. Slectionnez loption Built-in partir de la liste droulante Schema et renseignez manuellement les informations concernant le fichier dlimit dans les champs correspondants. Cliquez sur le bouton [...] ct du champ Edit schema pour afficher la bote de dialogue permettant de dfinir la structure des donnes. Dans ce scnario, le schma comporte quatre colonnes : Id, Name, Address et IdState. Cliquez sur le bouton [+] pour ajouter autant de lignes que ncessaire la structure des donnes. Dans cet exemple, il ny a quune seule colonne dans le schma : xmlStr. Cliquez sur OK pour valider vos changements et fermer la bote de dialogue. Si vous avez pralablement stock votre schma dans le rpertoire Metadata sous File delimited, slectionnez loption Repository dans la liste droulante Schema puis cliquez sur le bouton [...] ct du champ pour afficher la bote de dialogue [Repository Content] partir de laquelle vous pouvez slectionner un schma pertinent. Cliquez sur Ok pour fermer la bote de dialogue et remplir les champs automatiquement avec les mtadonnes contenues dans le schma. Pour plus dinformations sur le stockage des schmas de mtadonnes dans le Repository, consultez le Guide Utilisateur de Talend Open Studio. Assurez-vous que la case Skip empty rows est coche afin dignorer les lignes vierges. Double-cliquez sur le composant tFileOutputXML pour afficher longlet Basic settings du composant et configurer ses paramtres de base. Guide de Rfrence des Composants Talend Open Studio 1341

Scnario : Envoyer un e-mail lors dune erreur

Cliquez sur le bouton [...] ct du champ File Name pour slectionner le rpertoire de destination du fichier et saisissez le nom du fichier. Dans ce scnario, appelez le fichier customer_data.xml. Dans le champ Row tag, saisissez entre guillemets le nom que vous souhaitez donner la balise contenant les donnes. Cliquez sur Edit schema et assurez-vous que le schma est rcupr partir du schma dentre. Si ncessaire, cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Double-cliquez sur le composant tSendMail pour afficher longlet Basic settings du composant et configurer ses paramtres de base.

Saisissez les adresses e-mail des destinataires dans le champ To et les champs Cc et Bcc selon vos prfrences, ainsi que celle de lexpditeur dans le champ From. Cochez la case Show senders name? puis renseignez le nom de lexpditeur dans le champ Sendername pour que votre message ait une meilleure visibilit auprs de vos destinataires.

1342

Guide de Rfrence des Composants Talend Open Studio

Scnario : Envoyer un e-mail lors dune erreur

Renseignez lobjet du message dans le champ Subject. Saisissez dans le champ Message le message contenant le code derreur produit laide de la variable globale correspondante. Accdez la liste des variables en appuyant sur Ctrl+Espace. Ajoutez des pices jointes et des informations sur les en-ttes, si ncessaire, dans les champs respectifs Attachments et Other headers. Saisissez les informations SMTP dans les champs SMTP host et SMTP port. Enregistrez votre Job puis appuyez sur F6 pour lexcuter. Dans ce scnario, le fichier contenant les donnes transfrer vers une sortie XML ne peut tre trouv. Le composant tSendMail sexcute lorsque cette erreur est rencontre et envoie un mail de notification au destinataire spcifi.

Guide de Rfrence des Composants Talend Open Studio

1343

tSetKeystore

tSetKeystore

Proprits du tSetKeystore
Famille de composant Fonction Objectif Basic settings Internet Le composant tSetKeystore soumet des donnes dauthentification dun TrustStore avec ou sans Keystore pour valider la connexion SSL. Ce composant vous permet de dfinir le type des donnes dauthentification entre PKCS 12 et JKS. TrustStore type TrustStore file Slectionnez le type of the TrustStore to be used. It may be PKCS 12 or JKS. Saisissez le chemin daccs et le nom du fichier TrustStore, ou parcourez votre rpertoire jusquau TrustStore contenant la liste des certificats approuvs par le client. Saisissez le mot de passe utilis pour vrifier lintgrit des donnes TrustStore.

TrustStore password

Need Client authentica- Cochez cette case pour valider les donnes keystore. tion Vous devez ensuite complter trois champs : - KeyStore type : slectionnez le type de keystore utiliser. Il peut tre PKCS 12 ou JKS. - KeyStore file : saisissez le chemin daccs et le nom du fichier Keystore, ou parcourez votre rpertoire jusquau fichier contenant les donnes keystore. - KeyStore password : saisissez le mot de passe keystore. Advanced settings Utilisation Connexions tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant. Liens de sortie (dun composant un autre) : Trigger : Run if, On Subjob Ok, On Subjob Error, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Trigger : Run if, On Subjob Ok, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a.

Ce composant est utilis en standalone.

1344

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire des informations client dun fichier WSDL priv

Scnario : Extraire des informations client dun fichier WSDL priv


Ce scnario dcrit un Job comprenant trois composants, qui se connecte un fichier WSDL priv, pour extraire des informations client. Le fichier WSDL utilis dans ce Job accde au service Web correspondant via le protocole SSL. Le code correspondant dans le fichier est le suivant : <wsdl:port name="CustomerServiceHttpSoap11Endpoint" binding="ns:CustomerServiceSoap11Binding"> <soap:address location="https://192.168.0.22:8443/axis2/ services/CustomerService.CustomerServiceHttpSoap11Endpoint/"/> </wsdl:port> Saisissez le code suivant dans le fichier server.xml de Tomcat : <Connector port="8443" protocol="HTTP/1.1" SSLEnabled="true" maxThreads="150" scheme="https" secure="true" clientAuth="true" sslProtocol="TLS" keystoreFile="D:/server.keystore" keystorePass="password" keystoreType="JKS" truststoreFile="D:/server.p12" truststorePass="password" truststoreType="PKCS12" /> Vous avez besoin de fichiers Keystore pour vous connecter ce fichier WSDL. Pour reproduire ce Job, procdez comme suit : Dposez les composants suivants de la Palette dans lespace de modlisation graphique : tSetKeystore, tWebService, et tLogRow.

Cliquez-droit sur le composant tSetKeystore pour ouvrir son menu contextuel. Dans ce menu, slectionnez Trigger > On Subjob Ok afin de relier ce composant au tWebService. Cliquez-droit sur le tWebService pour ouvrir son menu contextuel. Dans ce menu, slectionnez Row > Main pour connecter ce composant au tLogRow. Double-cliquez sur le tSetKeystore pour ouvrir sa vue Basic settings et dfinir ses proprits.

Guide de Rfrence des Composants Talend Open Studio

1345

Scnario : Extraire des informations client dun fichier WSDL priv

Dans la liste TrustStore type, slectionnez PKCS12. Dans le champ TrustStore file, parcourez votre rpertoire jusquau fichier TrustStore. Ici, le fichier est server.p12. Dans le champ TrustStore password, saisissez le mot de passe pour ce fichier TrustStore. Dans cet exemple, le mot de passe est password. Cochez la case Need Client authentication afin dactiver les champs de configuration Keystore. Dans la liste KeyStore type, slectionnez JKS. Dans le champ KeyStore file, parcourez votre rpertoire jusquau fichier Keystore correspondant. Ici, le fichier est server.keystore. Double-cliquez sur le composant tWebService pour ouvrir lditeur du composant, ou slectionnez le composant dans lespace de modlisation graphique et dans sa vue Basic settings, cliquez sur le bouton [...] ct du champ Service configuration.

Dans le champ WSDL, parcourez votre rpertoire jusquau fichier WSDL priv utiliser. Dans cet exemple, ce fichier est CustomerService.wsdl. Cliquez sur le bouton Refresh ct du champ WSDL afin de rcuprer la description WSDL et lafficher dans les champs qui suivent.

1346

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire des informations client dun fichier WSDL priv

Dans la liste Port Name, slectionnez le port que vous souhaitez utiliser, CustomerServiceHttpSoap11Endpoint dans cet exemple. Dans la liste Operation, slectionnez le service que vous souhaitez utiliser. Dans cet exemple, le service slectionn est getCustomer(parameters):Customer. Cliquez sur Next pour ouvrir une nouvelle vue dans lditeur.

Dans le panneau de droite de la vue Input mapping, le paramtre dentre du service saffiche automatiquement. Cependant, vous pouvez ajouter dautres paramtres si vous slectionnez [+] parameters et que vous cliquez sur le bouton [+] en haut, afin dafficher la bote de dialogue [Parameter Tree] dans laquelle vous pouvez slectionner nimporte lequel des paramtres lists. Le service Web de cet exemple na quun seul paramtre dentre, ID. Dans la colonne Expression de la ligne parameters.ID, saisissez entre guillemets lID du client qui vous intresse. Dans cet exemple, lID est A00001. Cliquez sur Next pour ouvrir une nouvelle vue dans lditeur.

Dans la liste Element gauche de la vue saffiche automatiquement le paramtre de sortie du service Web. Cependant, vous pouvez ajouter dautres paramtres si vous slectionnez [+] parameters et que vous cliquez sur le bouton [+] en haut afin dafficher la bote de dialogue [Parameter Tree] dans laquelle vous pouvez slectionner nimporte lequel des paramtres affichs.

Guide de Rfrence des Composants Talend Open Studio

1347

Scnario : Extraire des informations client dun fichier WSDL priv

Le service Web dans cet exemple contient quatre paramtres de sortie : return.address, return.email, return.name et return.phone. Vous devez crer une connexion entre le paramtre de sortie du service Web dfini et le schma du composant de sortie. Pour ce faire : Dans le panneau droite de la vue, cliquez sur le bouton [...] ct du champ Edit Schema afin douvrir une bote de dialogue dans laquelle vous pouvez dfinir le schma de sortie.

Dans lditeur de schma, cliquez sur le bouton [+] pour ajouter quatre colonnes au schma de sortie. Cliquez dans chaque colonne et saisissez les nouveaux noms : Name, Phone, Email et Address dans cet exemple. Cela vous permettra de rcuprer les informations client qui vous intressent. Cliquez sur OK pour valider les modifications et fermer la bote de dialogue du schma. Dans la liste Element droite de lditeur, glissez chaque paramtre dans le champ correspondant la colonne que vous avez dfinie dans lditeur de schma. Sil est disponible, vous pouvez utiliser le bouton Auto map!, situ en bas gauche de linterface, afin deffectuer lopration de mapping automatiquement. Cliquez sur OK pour valider vos modifications et femer lditeur. Dans lespace de modlisation graphique, double-cliquez sur le composant tLogRow afin douvrir sa vue Basic settings et dfinir ses proprits. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Les informations du client dont lID est A00001 sont retournes et affiches dans la console de Talend Open Studio.

1348

Guide de Rfrence des Composants Talend Open Studio

tSocketInput

tSocketInput

Proprits du tSocketInput
Famille de composant Fonction Objectif Basic settings Internet Le composant tSocketInput ouvre un port de socket et permet dcouter les donnes envoyes. Le tSocketInput est un composant dcoute, permettant de transmettre des donnes via un port dfini. Host name Port Timeout Uncompress Die on error Nom ou adresse IP du serveur Hte. Port dcoute ouvrir. Nombre de secondes avant fermeture du socket du port dcoute. Cochez cette case pour extraire les donnes si ncessaire. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Caractre, chane ou expression rgulire sparant les champs. Chane (ex : \nsous Unix) utilise pour sparer les lignes. Caractre de la ligne viter. Caractres utiliss pour entourer le texte.

Field separator Row separator Escape Char Text enclosure

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement leGuide utilisateur de Talend Open Studio. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes.

Guide de Rfrence des Composants Talend Open Studio

1349

Scnario : Transfrer des donnes vers un port dcoute

Utilisation Limitation

Ce composant ouvre un point daccs au poste de travail ou au serveur. Ce composant est un composant de dbut de Job et sarrte uniquement aprs expiration. n/a

Scnario : Transfrer des donnes vers un port dcoute


Le scnario suivant dcrit un double Job dont le but est de transfrer des donnes via un port dcoute. Le composant Socket peut aussi permettre de contrler la communication entre les serveurs ne pouvant pas communiquer directement entre eux.

Crez deux Jobs : le premier (SocketInput) ouvre un port dcoute et attend que les donnes soient envoyes. Le deuxime (SocketOutput) transmet des donnes dlimits dun fichier vers le numro de port correspondant au port dcoute. Dans le premier Job, cliquez et dposez les composants suivants : tSocketInput et tLogRow. Dans le deuxime Job, cliquez et dposez les composants suivants : tFileInputDelimited et tSocketOutput. Commencez par configurer les paramtres du deuxime Job. Slectionnez tFileInputDelimited et dans longlet Basic Settings de la vue Component, configurez les paramtres daccs au fichier dentre.

Dans le champ File Name, renseignez le chemin daccs au fichier. Renseignez les sparateurs de lignes et de champs respectivement dans les champs Row et Field separators, ainsi que len-tte dans le champ Header.

1350

Guide de Rfrence des Composants Talend Open Studio

Scnario : Transfrer des donnes vers un port dcoute

Dcrivez le schma des donnes passer au composant tSocketOutput. Slectionnez le composant tSocketOutput et configurez les paramtres de longlet Basic Settings de la vue Component.

Dans le champ Host, renseignez ladresse IP et dans le champ Port, renseignez le numro du port vers lequel les donnes seront transfres. Dans le champ Retry, dfinissez le nombre dessais effectuer et dans le champ Timeout renseignez la dure (en seconde) avant que le Job ne sarrte automatiquement. Configurez le reste des options si ncessaire. Le schma devrait se propager du composant prcdent. Maintenant, configurez les paramtres du premier Job (SocketInput) contenant le composant tSocketInput.

Dans le champ Host, renseignez ladresse IP et dans le champ Port, renseignez le numro du port dcoute vers lequel les donnes sont transfres. Dans le champ Timeout, dfinissez la dure (en secondes) avant que le Job ne sarrte automatiquement. Configurez le reste des options si ncessaire. Modifiez le schma afin quil corresponde en tout point ou en partie au schma du deuxime Job. Laissez les proprits par dfaut du composant tLogRow. Excutez le Job SocketInput en premier, afin douvrir le port dcoute et de le prparer recevoir les donnes.

Guide de Rfrence des Composants Talend Open Studio

1351

Scnario : Transfrer des donnes vers un port dcoute

Avant que le Job ne sarrte, lancez lautre Job (SocketOutput) afin de transmettre les donnes. Le rsultat saffiche dans la vue Run, ainsi que les informations douverture du socket.

1352

Guide de Rfrence des Composants Talend Open Studio

tSocketOutput

tSocketOutput

Proprits du tSocketOutput
Famille de composant Fonction Objectif Basic settings Internet Le composant tSocketOutput crit des donnes sur un port dcoute. Le tSocketOutput transfert des donnes dun flux dentre vers le port dcoute du socket. Host Port Compress Retry times Timeout Field separator Row separator Escape Char Text enclosure Nom ou adresse IP du serveur Hte. Port dcoute ouvrir Cochez cette case pour archiver les donnes si ncessaire. Nombre dessais avant que le Job ne soit mis en chec. Nombre de secondes avant fermeture du port dcoute. Caractre, chane ou expression rgulire sparant les champs. Chane (ex : \n sous Unix) sparant les lignes. Caractre de la ligne viter. Caractres utiliss pour entourer le texte.

Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes des bases de donnes.

Utilisation Limitation

Ce composant ouvre un point daccs au poste de travail ou au serveur. Ce composant est un composant de dbut de Job et sarrte uniquement aprs expiration. n/a

Guide de Rfrence des Composants Talend Open Studio

1353

Scnario associ

Scnario associ
Pour un exemple dutilisation du tSocketOutput, consultez la section intitule Scnario : Transfrer des donnes vers un port dcoute

1354

Guide de Rfrence des Composants Talend Open Studio

tSOAP

tSOAP

Proprits du tSOAP
Famille de composant Fonction Internet Le composant tSOAP envoie le message SOAP dfini avec les paramtres donns au service Web invoqu et retourne la valeur comme dfinie, partir des paramtres donns. Ce composant appelle une mthode via un service Web afin de rcuprer les valeurs des paramtres dfinies dans lditeur du composant. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Ce composant utilise toujours un schma local (builtin) en lecture seule qui contient trois colonnes : - Header : stocke len-tte du message SOAP de la rponse donne ct serveur. - Body : stocke le corps du message SOAP de la rponse donne ct serveur. - Fault : stocke les informations derreur lorsquune erreur survient pendant le traitement du message SOAP. Cliquez sur Edit Schema pour visualiser le schma. Modifier le schma peut engendrer une perte de la structure du schma et donc un chec du composant. Use NTLM Cochez cette case si vous utilisez un protocole dauthentification NTLM. Domain : Nom de domaine du client. Need authentication Cochez la case dauthentification et renseignez le nom de lutilisateur dans le champ Username et son mot de passe dans le champ Password, si cela est ncessaire pour accder au service. Cochez cette case si vous vous connectez derrire un proxy et renseignez les informations correspondantes. Cochez cette case pour authentifier le serveur auprs du client via un protocole SSL et renseignez les champs correspondants. TrustStore file : saisissez le chemin daccs et le nom du fichier TrustStore contenant la liste des certificats approuvs par le client.

Objectif Basic settings

Use http proxy Trust server with SSL

Guide de Rfrence des Composants Talend Open Studio

1355

Scnario : Extraire des informations mto en utilisant un Service Web

TrustStore password : saisissez le mot de passe utilis pour vrifier lintgrit des donnes TrustStore. ENDPOINT SOAP action SOAP version Saisissez lURL du serveur Web invoqu. Saisissez lURL de len-tte HTTP SOAPAction utiliser pour identifier le but de la requte HTTP SOAP. Slectionnez la version du systme SOAP que vous utilisez. Lenveloppe SOAP requise varie selon les versions. SOAP message Saisissez le message SOAP envoyer au service Web invoqu. Les variables globales et de contexte peuvent tre utilises lorsque vous crivez un message SOAP. Pour plus dinformations concernant les variables de contexte, consultez le Guide Utilisateur Talend Open Studio. Advanced settings Temporary folder (for Dfinissez (ou parcourez votre rpertoire jusqu) un wsdl2java) dossier temporaire configur o stocker les fichiers WSDL. tStatCatcher Statistics Utilisation Connexions Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant. Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Component Ok, On Component Error. Liens dentre (dun composant un autre) : Row : Main, Iterate Trigger : Run if, On Component Ok, On Component Error. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio. Limitation N/A

Ce composant peut tre utilis en tant que composant dentre ou intermdiaire.

Scnario : Extraire des informations mto en utilisant un Service Web


Ce scnario Java dcrit un Job deux composants utilisant un Service Web pour rcuprer les informations concernant la mto dune ville amricaine. Le service Web utiliser est http://www.deeptraining.com/webservices/weather.asmx. Dposez les composants suivants de la Palette dans lespace de modlisation graphique : tSOAP et tLogRow.

1356

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire des informations mto en utilisant un Service Web

Cliquez-droit sur le composant tSOAP afin douvrir le menu contextuel. Slectionnez Row > Main. Cliquez sur le tLogRow pour relier les composants laide dun lien Main Row. Double-cliquez sur le tSOAP afin douvrir sa vue Basic settings et dfinir ses proprits.

Dans le champ ENDPOINT, saisissez ou collez lURL du Service Web utiliser, entre guillemets : http:// www.deeptraining.com/webservices/weather.asmx. Dans le champ SOAP Action, saisissez ou collez lURL de len-tte HTTP SOAPAction permettant de dterminer que vous souhaitez rcuprer les informations concernant la mto : http://litwinconsulting.com/webservices/GetWeather. Vous pouvez voir cette adresse en regardant le WSDL du Service Web que vous appelez. Pour le Service Web de cet exemple, dans votre navigateur, saiaissez ?wsdl la fin de lURL du Service Web utilis dans le champ ENDPOINT, ouvrez la page Web correspondante, puis regardez laction SOAPAction dfinie sous le noeud Operation : <wsdl:operation name="GetWeather"> <soap:operation soapAction="http://litwinconsulting.com/webservices/ GetWeather" style="document"/> Dans le champ SOAP version, slectionnez la version du systme SOAP utilis. Dans ce scnario, la version est SOAP 1.1. Dans le champ SOAP message, saisissez le message, au format XML, utilis pour rcuprer les informations du Service Web invoqu. Dans cet exemple, rcuprez les informations mto de Chicago, saisissez donc :

Guide de Rfrence des Composants Talend Open Studio

1357

Scnario : Extraire des informations mto en utilisant un Service Web

"<soapenv:Envelope xmlns:soapenv=\"http://schemas.xmlsoap.org/soap/ envelope/\" xmlns:web=\"http://litwinconsulting.com/webservices/\"> <soapenv:Header/> <soapenv:Body> <web:GetWeather> <web:City>Chicago</web:City> </web:GetWeather> </soapenv:Body> </soapenv:Envelope>" Sauvegardez votre Job et appuyez sur F6 pour lexcuter. La mto de Chicago est rcupre et affiche dans la console de la vue Run.

1358

Guide de Rfrence des Composants Talend Open Studio

tWebServiceInput

tWebServiceInput

Proprits du tWebServiceInput
Famille de composant Fonction Objectif Internet Ce composant appelle la mthode du service Web invoqu et retourne la classe dfinie en fonction des paramtres donns. Le tWebServiceInput invoque une mthode via un service Web dont lobjectif est celui dcrit dans les proprits. Pour traiter des donnes complexes hirarchiques, vous devez utiliser les fonctions avances du tWebServiceInput en codant directement du Java dans le champ Code de la vue Advanced settings. Basic settings Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier dans lequel sont stockes les proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Cliquez sur cette icne pour ouvrir lassistant de cration de schma WSDL et enregistrer les paramtres de connexion WSDL que vous avez dfinis dans la vue Basic settings du composant dans le Repository. Pour plus dinformations sur la configuration et le stockage des paramtres de connexion WSDL, consultez le Guide Utilisateur de Talend Open Studio. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. WSDL Description des bindings et de la configuration du service Web.

Need authentication / Cochez cette case dauthentification et : Username et Password - Saisissez un identifiant, ainsi quun mot de passe, dans les champs correspondants, si ncessaire pour accder au service. Sinon,

Guide de Rfrence des Composants Talend Open Studio

1359

Proprits du tWebServiceInput

- Cochez la case Windows authentication et saisissez le nom de domaine Windows dans le champ correspondant si cela est ncessaire pour accder au service. Use http proxy Java uniquement Trust server with SSL Cochez cette case si vous vous connectez derrire un proxy et renseignez les informations correspondantes. Cochez cette case pour authentifier le serveur auprs du client via un protocole SSL et renseignez les champs correspondants. TrustStore file : saisissez le chemin daccs et le nom du fichier TrustStore contenant la liste des certificats approuvs par le client. TrustStore password : saisissez le mot de passe utilis pour vrifier lintgrit des donnes TrustStore. Java uniquement Time out (second) Method Name Saisissez en secondes la dure de connexion au service Web. Saisissez le nom exact de la mthode invoquer. Le nom de la mthode DOIT correspondre la mthode dcrite dans le service Web. Le nom de la mthode est sensible la casse. Parameters Saisissez les paramtres attendus et les valeurs retourner. Assurez-vous que les paramtres saisis correspondent parfaitement aux noms et la casse des paramtres dcrits dans la mthode. Cochez cette case pour afficher les champs suivants permettant dutiliser les fonctions avances du unique- tWebServiceInput : WSDL2Java : cliquez sur le bouton [...] pour gnrer des routines contenant les codes Java ncessaires la connexion et linterrogation du service Web. Code : saisissez le code permettant de se connecter et dinterroger le service Web en vous basant sur les deux modles proposs en utilisant les routines gnres automatiquement. Match Brackets : slectionnez le nombre daccolades utiliser pour fermer la boucle for en fonction du nombre daccolades ouvertes. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du Job ainsi quau niveau de chaque composant.

Advanced settings

Advanced Use Java ment

Ce composant est gnralement utilis comme composant de dbut. Il requiert un composant de sortie. n/a

1360

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Extraire des images laide dun Webservice

Scnario 1 : Extraire des images laide dun Webservice


Ce scnario dcrit un Job constitu de deux composants dont le but est dutiliser une mthode de service Web et dafficher le rsultat en sortie dans une vue standard. La mthode rcupre une adresse URL complte sous forme de chane en entre et retourne une liste dimages provenant dune page Web donne.

Cliquez et dposez les composants tWebServiceInput et tLogRow. Dans la vue Component du composant tWebServiceInput, configurez les spcifications WSDL : WSDL et End Point URI lorsque cela est ncessaire. Si le service Web invoqu requiert des informations dauthentification, cochez la case Need authentication? et renseignez ces informations.

Si vous vous connectez derrire un proxy, cochez la case Use http proxy et renseignez les champs concernant lhte, lutilisateur, le port et le mot de passe. Dans le champ Method Name, saisissez le nom de la mthode tel que dfini dans la description du service Web. Le nom et la casse de la mthode saisie doivent correspondre parfaitement la mthode du service Web demand.

Guide de Rfrence des Composants Talend Open Studio

1361

Scnario 2 : Lire des donnes publies dans un service Web, en utilisant les fonctions avances du tWebServiceInput

Dans la zone Parameters, cliquez sur le bouton [+] pour ajouter une ligne au tableau, puis saisissez le nom exact des paramtres tel quattendus par la mthode. Dans la colonne Value, saisissez ladresse URL du site Web partir duquel les images seront extraites. Connectez le composant tWebServiceInput au composant de sortie standard, tLogRow. Appuyez sur F6 pour excuter le Job.

Toutes les images extraites du site Web spcifi sont retournes dans la vue Run, sous la forme dune liste dadresses URL.

Scnario 2 : Lire des donnes publies dans un service Web, en utilisant les fonctions avances du tWebServiceInput
Ce scnario dcrit un Job constitu de deux composants dont le but est de rcuprer une liste de fonds publie sur un service Web financier (distribu par www.xignite.com) et dafficher le rsultat en sortie dans la vue standard (la vue Run). Ce scnario est destin des utilisateurs avancs ayant des notions de Java. En effet, lobjectif de ce Job tant de rcuprer des donnes complexes hirarchiques, il est ncessaire de coder en Java les fonctions dont vous avez besoin pour rcuprer ces donnes.

1362

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Lire des donnes publies dans un service Web, en utilisant les fonctions avances du tWebServiceInput Cliquez et dposez le composant tWebServiceInput de la famille Internet et le composant tLogRow de la famille Logs & Errors dans lespace de modlisation. Reliez les composants laide dune connexion de type Row Main. Double-cliquez sur le tWebServiceInput pour afficher la vue Component et paramtrer ses proprits :

Dans longlet Basic settings : Dans la liste Property Type, slectionnez loption Built-in et renseignez manuellement les champs suivants. Dans la liste Schema Type, slectionnez Built-in et cliquez sur le bouton [...] pour configurer manuellement le schma comme dans la figure ci-dessous :

Cliquez sur OK pour valider le schma et fermer la fentre. Une bote de dialogue souvre et vous demande si vous souhaitez propager les modifications. Cliquez sur Yes (Oui). Dans le champ WSDL, saisissez ladresse du WSDL auquel vous connecter. Dans le champ Time out, saisissez en secondes la dure de la connexion au service Web.

Guide de Rfrence des Composants Talend Open Studio

1363

Scnario 2 : Lire des donnes publies dans un service Web, en utilisant les fonctions avances du tWebServiceInput Cliquez sur longlet Advanced settings pour renseigner les fonctions avances du composant tWebServiceInput :

Cochez la case Advanced Use pour afficher les champs de configuration avance. Cliquez sur le bouton [...] situ ct du champ WSDL2Java pour gnrer automatiquement des routines partir du WSDL du service Web.

Ces routines apparaissent sous le nud Code > Routines du Repository, et peuvent tre utilises dans le code pour construire les fonctions ncessaires la rcupration des donnes hirarchiques du service Web. Saisissez les fonctions adquates dans le champ Code. Par dfaut, deux exemples de code sont fournis dans le champ Code : le premier sert retourner une donne et le deuxime en retourner plusieurs. Pour ce scnario, lobjectif est de retourner plusieurs donnes. Ainsi, supprimez le premier exemple de code et utilisez le deuxime exemple de code pour construire les fonctions.

1364

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Lire des donnes publies dans un service Web, en utilisant les fonctions avances du tWebServiceInput Dans le deuxime exemple, remplacez les morceaux de code exemple par le code correspondant gnr dans les routines partir du WDSL. Remplacez TalendJob_PortType par le nom de la routine terminant par _Port_Type : XigniteFundHoldingsSoap_PortType. Remplacez les diffrentes instances de TalendJob par un nom plus parlant tel que le nom de la mthode utilise : fundHolding. Remplacez TalendJobServiceLocator par le nom de la routine terminant par Locator : XigniteFundHoldingsLocator. Remplacez les deux instances de TalendJobSoapBindingStub par le nom de la routine terminant par BindingStub : XigniteFundHoldingsSoap_BindingStub. Dans les parenthses correspondant aux codes stub.setUsername et stub.setPassword, saisissez respectivement votre identifiant et votre mot de passe entre guillemets. Dans un souci de confidentialit ou de maintenance, vous pouvez mettre votre identifiant et votre mot de passe dans des variables de contexte. La liste des fonds fournis par le service Web de Xignite sont identifis laide de symboles (Symbol), qui sont de type String (chane de caractres). Dans cet exemple, lobjectif est de rcuprer la liste des fonds dont la premire lettre du symbole est comprise entre I et J. Pour cela, dfinissez les arguments utiliser : string startSymbol=I et String endSymbol=J. Puis saisissez le code permettant de crer le tableau de rsultat rcuprant la liste des fonds (listFunds) de participation (fundholdings) en utilisant les arguments dfinis : routines.Fund[] result = fundHoldings.listFunds(startSymbol, endSymbol); Effectuez une boucle sur la liste des fonds pour rcuprer les fonds compris entre I et J : for(int i = 0; i < result.length; i++) { Puis dfinissez les sorties retourner, par exemple : rcuprez les donnes CIK du schma Security avec le code getSecurity().getCIK() et transmettez-les au champ CIK du schma de sortie. Le code obtenu pour faire fonctionner le service Web doit correspondre au code suivant : routines.XigniteFundHoldingsSoap_PortType fundHoldings = new routines.XigniteFundHoldingsLocator().getXigniteFundHoldingsSoap(); routines.XigniteFundHoldingsSoap_BindingStub stub = (routines.XigniteFundHoldingsSoap_BindingStub)fundHoldings; stub.setUsername(identifiant); stub.setPassword(mot de passe); String startSymbol="I"; String endSymbol="J"; routines.Fund[] result = fundHoldings.listFunds(startSymbol, endSymbol); for(int i = 0; i < result.length; i++) { output_row.CIK = (result[i]).getSecurity().getCIK(); output_row.cusip = (result[i]).getSecurity().getCusip(); output_row.symbol = (result[i]).getSecurity().getSymbol(); output_row.ISIN = (result[i]).getSecurity().getISIN(); output_row.valoren = (result[i]).getSecurity().getValoren();

Guide de Rfrence des Composants Talend Open Studio

1365

Scnario 2 : Lire des donnes publies dans un service Web, en utilisant les fonctions avances du tWebServiceInput output_row.name = (result[i]).getSecurity().getName(); output_row.market = (result[i]).getSecurity().getMarket(); output_row.category = (result[i]).getSecurity().getCategoryOrIndustry(); output_row.asOfDate = (result[i]).getAsOfDate(); Les sorties dfinies dans le code Java output_row.sortie doivent correspondre exactement aux noms des colonnes dfinis dans le schma du composant. En effet, la casse doit tre respecte pour que les donnes soient rcupres. Dans le champ Match Brackets, slectionnez le nombre daccolades utiliser pour fermer la boucle for en fonction du nombre daccolades ouvertes. Pour ce scnario, slectionnez une seule accolade puisquune seule accolade a t ouverte dans le code. Double-cliquez sur le composant tLogRow pour afficher la vue Component et paramtrer ses proprits. Cliquez sur le bouton [...] situ ct du champ Edit Schema pour vrifier que le schma du composant prcdent a bien t propag au composant de sortie. Sinon, cliquez sur le bouton Sync columns pour rcuprer le schma. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Les fonds compris entre I et J sont retourns et affichs dans la console de Talend Open Studio.

1366

Guide de Rfrence des Composants Talend Open Studio

tXMLRPCInput

tXMLRPCInput

Proprits du tXMLRPCInput
Famille de composant Fonction Objectif Basic settings Internet Ce composant appelle la mthode du service RPC invoqu et retourne la classe dfinie en fonction des paramtres donns. Le composant tXMLRPCInput invoque une mthode via un service Web dont lobjectif est celui dcrit dans les proprits. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Dans le contexte du RPC, le schma correspond aux paramtres de sortie. Si deux paramtres doivent tre retourns, alors le schma comportera deux colonnes. Server URL Adresse URL du service RPC accder Need authentication / Cochez la case dauthentification et renseignez le nom Username et Password de lutilisateur (username) et son mot de passe (password), si cela est ncessaire pour accder au service. Method Name Saisissez le nom exact de la mthode invoquer. Le nom de la mthode DOIT correspondre parfaitement la mthode dcrite dans le service RPC. Le nom de la mthode est sensible la casse. Return class Slectionnez le type de donnes retourner par la mthode. Assurez-vous quil correspond parfaitement celui dfini dans la mthode. Saisissez les paramtres attendus en entre par la mthode.

Parameters Utilisation Limitation

Ce composant est gnralement utilis comme composant de dbut. Il ncessite un composant de sortie. n/a

Guide de Rfrence des Composants Talend Open Studio

1367

Scnario : Chercher le nom dun Etat via une mthode XMLRPC

Scnario : Chercher le nom dun Etat via une mthode XMLRPC


Ce scnario dcrit un Job deux composants utilisant une mthode RPC et affichant le rsultat dans la console.

Cliquez et dposez les composants tXMLRPCInput et tLogRow. Dans longlet Basic settings, paramtrez les proprits du composant tXMLRPCInput.

Dans la liste droulante Schema type, slectionnez loption Built-in. Configurez un schma contenant une unique colonne puisque seul un paramtre est attendu en sortie : StateName.

Dans le champ Server url, renseignez ladresse URL du serveur. Pour cet exemple, utilisez : http:// phpxmlrpc.sourceforge.net/server.php Aucune information dauthentification nest ncessaire pour cet exemple. Dans le champ Method, renseignez la mhode appeler, ici : examples.getStateName Pour cet exemple, la classe retourne nest pas obligatoire. Ainsi, dans le champ return class, laissez les paramtres par dfaut. Puis, dans le tableau Parameters, configurez les paramtres ncessaires la mthode appele. La colonne Name nest pas utilise dans le code mais la valeur doit correspondre la syntaxe attendue par la mthode. Dans cet exemple, saisissez State Nr dans le champ Name et dans le champ Value, choisissez un numro au hasard, ici : 42.

1368

Guide de Rfrence des Composants Talend Open Studio

Scnario : Chercher le nom dun Etat via une mthode XMLRPC

La classe na pas beaucoup dimpact sur cette mthode dmo mais pourrait en avoir sur une autre mthode. Ainsi, laissez les paramtres par dfaut. Dans la vue Component du composant tLogRow, cochez la case Print schema column name in front of each value. Enregistrez le Job puis excutez-le, en appuyant sur F6.

Le rsultat obtenu en sortie en utilisant la mthode RPC GetStateName et correspondant au quarante deuxime Etat des Etats-Unis est donc South Dakota.

Guide de Rfrence des Composants Talend Open Studio

1369

Guide de Rfrence des Composants Talend Open Studio

Composants Logs & Errors


Ce chapitre passe en revue les principaux composants de la famille Logs & Errors de la Palette de Talend Open Studio. La famille Logs & Errors regroupe les composants ddis la gestion des donnes de log et des erreurs des Jobs.

Guide de Rfrence des Composants Talend Open Studio

tAssert

tAssert

Proprits du tAssert
Le composant tAssert est troitement li au tAssertCatcher pour tester une excution de Job. Il gnre une assertion boolenne partir dune instruction conditionnelle, dans le but dalimenter le statut dexcution prsent par le tAssertCatcher. Famille de composant Fonction Objectif Logs & Errors Envoie le message de statut du Job au tAssertCatcher. Gnre lassertion boolenne relative lanalyse du Job. Le statut peut tre : Ok : lexcution du Job a russi. Fail : lexcution a chou. Les rsultats du Job test ne correspondent pas ce qui tait attendu, ou une erreur est survenue lors de lexcution. Basic settings Description Expression Utilisation Saisissez votre message descriptif afin d'identifier l'assertion du tAssert. Saisissez linstruction conditionnelle sur laquelle baser votre assertion.

Ce composant suit l'action laquelle est lie directement la condition assertive. Il peut tre utilis comme composant intermdiaire ou final du Job principal, ou bien en tant que composant de dbut, intermdiaire ou de fin du Job secondaire. Lvaluation du tAssert est capture par le tAssertCatcher.

Limitation

Scnario : Paramtrer une condition assertive pour lexcution dun Job


Ce scnario dcrit comment paramtrer une condition assertive dans le composant tAssert afin dvaluer si lexcution du Job a russi ou non. De plus, vous pouvez galement trouver comment deux rsultats diffrents dvaluation saffichent et comment les lire. Le scnario utilise un tAssert, mais aussi : un tFileInputDelimited et un tFileOutputDelimited. Les deux composants constituent le Job principal, duquel le statut dexcution est valu. Pour plus dinformations sur ces deux composants, consultez la section intitule tMDMOutput et la section intitule tFileOutputDelimited . un tFileCompare. Il ralise la comparaison entre le fichier de sortie du Job principal et un fichier de rfrence standard. Le rsultat comparatif est valu par le tAssert par rapport la condition assertive configure dans ses paramtres. Pour plus dinformations propos du tFileCompare, consultez la section intitule tFileCompare . un tAssertCatcher. Il capture lvaluation gnre par le tAssert. Pour plus dinformations propos du composant tAssertCatcher, consultez la section intitule tAssertCatcher . un tLogRow. Il vous permet de lire lvaluation capture. Pour plus dinformations propos du tLogRow, consultez la section intitule tLogRow .

1372

Guide de Rfrence des Composants Talend Open Studio

Scnario : Paramtrer une condition assertive pour lexcution dun Job

Afin de crer le Job principal, procdez comme suit : Prparez un fichier dlimit .csv comme fichier source lu par votre Job principal. Editez deux lignes dans ce fichier. Les modifications nont pas dimportance, vous pouvez uniquement simplifier le contenu. Nommez-le source.csv. Dans Talend Open Studio, crez un nouveau Job, que vous appellerez JobAssertion. Placez un tFileInputDelimited et un tFileOutputDelimited dans lespace de modlisation graphique. Connectez- les laide dun lien Row Main afin de crer le Job principal.

Double-cliquez sur le tFileInputDelimited afin douvrir sa vue Component. Dans le champ File Name de la vue Component, renseignez le chemin daccs votre fichier source.csv.

Slectionnez dans la liste Property Type le mode Built-In et cliquez sur le bouton [...] de loption Edit schema afin de dfinir les donnes passer au tFileOutputDelimited. Dans ce scnario, slectionnez les donnes prsentes dans le fichier source.csv que vous avez cr. Pour plus dinformations propos des types de schma, consultez le Guide Utilisateur Talend Open Studio. Dfinissez les autres paramtres dans les champs correspondants, selon le fichier source.csv que vous avez cr. Double-cliquez sur le tFileOutputDelimited afin douvrir sa vue Component. Dans le champ File Name de la vue Component, renseignez le chemin daccs votre fichier de sortie, et laissez les autres champs comme dfinis par dfaut.

Guide de Rfrence des Composants Talend Open Studio

1373

Scnario : Paramtrer une condition assertive pour lexcution dun Job

Appuyez sur F6 afin dexcuter le Job principal. Il lit votre fichier source.csv, passe les donnes au tFileOutputDelimited et crit un fichier dlimit de sortie, out.csv. Continuez modifier votre Job, afin de voir comment le tAssert value le statut dexcution du Job principal. Renommez le fichier out.csv en reference.csv. Ce fichier est le rsultat attendu de lcriture du Job principal. Placez un tFileCompare, un tAssert et un tLogRow dans lespace de modlisation graphique. Connectez-les avec un lien Row Main. Connectez le tFileInputDelimited au tFileCompare avec un lien OnSubjobOk.

Double-cliquez sur le tFileCompare afin douvrir sa vue Component. Dans la vue Component, renseignez les chemins daccs dans les champs File to compare et Reference file correspondants, et laissez les autres champs comme dfinis par dfaut.

Pour plus dinformations propos du composant tFileCompare, consultez la section intitule tFileCompare . Cliquez ensuite sur le tAssert, puis cliquez sur longlet Component, au bas de lespace de modlisation graphique.

1374

Guide de Rfrence des Composants Talend Open Studio

Scnario : Paramtrer une condition assertive pour lexcution dun Job

Dans la vue Component, ditez la condition row2.differ==0, dans le champ expression ainsi que la description de lassertion. Dans le champ expression, row2 constitue le flux de donnes transmis du tFileCompare au tAssert, differ est une colonne du schma du tFileCompare qui affiche si les fichiers compars sont identiques. 0 signifie quaucune diffrence na t dtecte entre le fichier out.csv et le fichier reference.csv par le tFileCompare. Les fichiers compars sont donc identiques, la condition assertive est remplie, le tAssert conclut que le Job principal a t excut avec succs. Sinon, il conclut quil a chou. La colonne differ fait partie du schma, en lecture seule, du tFileCompare. Pour plus dinformations sur son schma, consultez la section intitule tFileCompare . Appuyez sur F6 afin dexcuter votre Job. Vrifiez le rsultat retourn dans la vue Run.

La console affiche les rsultats de la comparaison du tFileCompare : Files lvaluation du tAssert nest visible nulle part. Vous avez donc besoin du composant tAssertCatcher pour capturer lvaluation.

are

identical. Mais

Placez un tAssertCatcher et un tLogRow dans lespace de modlisation graphique. Connectez-les laide dun lien Row Main.

Guide de Rfrence des Composants Talend Open Studio

1375

Scnario : Paramtrer une condition assertive pour lexcution dun Job

Utilisez la configuration par dfaut du tAssertCatcher dans sa vue Component.

Appuyez sur F6 afin dexcuter votre Job. Vrifiez les rsultats prsents dans la vue Run. Vous pouvez voir que les informations sur le statut du Job ont t ajoutes : 2010-01-29 15:37:33|fAvAzH|TASSERT|JobAssertion|java|tAssert_1|Ok|--| The output file should be identical with the reference file.

La description du JobAssertion dans la console est organise selon le schma du tAssertCatcher, lequel comprend des colonnes correspondant au temps dexcution, lID trait, au nom du projet, au langage du code, lorigine de lvaluation, le rsultat de lvaluation, les informations dtailles de lvaluation, et le message descriptif de lassertion. Pour plus dinformations propos du schma du tAssertCatcher, consultez la section intitule tAssertCatcher . La console indique que le statut dexcution du Job JobAssertion est Ok. En plus de lvaluation, vous pouvez toujours voir les informations descriptives du JobAssertion, parmi lesquelles la description que vous avez saisie dans les Basic settings du tAssert. Effectuez ensuite quelques oprations pour que le Job principal ne puisse gnrer le fichier attendu. Pour ce faire, procdez comme suit :

1376

Guide de Rfrence des Composants Talend Open Studio

Scnario : Paramtrer une condition assertive pour lexcution dun Job

Effacez une ligne de votre fichier reference.csv. Appuyez sur F6 pour excuter votre Job nouveau. Vrifiez les rsultats retourns dans la vue Run. 2010-02-01 19:47:43|GeHJNO|TASSERT|JobAssertion|tAssert_1|Failed|Test logically failed|The output file should be identical with the reference file

La console indique que le statut dexcution du Job principal est Failed (a chou). Lexplication dtaille suit peu aprs, Test logically failed (chec logique du test). Vous pouvez avoir une ide du statut de votre Job : il a chou lors de la gnration du fichier attendu cause dun chec logique. Cet chec logique peut provenir dune erreur logique lors de la cration du Job. Le statut et ses explications sont prsents respectivement dans les colonnes de statut et de sous-statut du schma du tAssertCatcher. Pour plus dinformations propos de cette colonne, consultez la section intitule tAssertCatcher .

Guide de Rfrence des Composants Talend Open Studio

1377

tAssertCatcher

tAssertCatcher

Proprits du tAssertCatcher
Famille de composant Fonction Objectif Basic settings Logs & Errors A partir de son schma prdfini, le tAssertCatcher retrouve les informations des statuts d'excution, des excutions des Jobs et du tAssert. Gnre un flux de donnes consolidant les informations de statut dune excution de Job, et transfre les donnes dans les fichiers de sortie dfinis. Schema type Un schma est une description de lignes, i.e., il dfinit les champs traiter et passer au composant suivant. Pour ce composant, le schma est en lecture seule puisquil regroupe les informations de log standard, notamment : Moment : Date et heure de traitement. Pid : ID traits. Project : Projet auquel appartiennent les Jobs analyss. Job : Nom du Job analys. Origin : Origine de lassertion de statut. Elle peut provenir de diffrents composants tAssert. Status : Jugements retrouvs partir du tAssert. Ils peuvent tre : - Ok : si linstruction conditionnelle du tAssert est value comme vraie (true) lexcution. - Failed : si linstruction conditionnelle du tAssert est value comme fausse (false), ou si des erreurs surviennent lexcution. Les rsultats du Job test ne correspondent pas ce qui tait attendu, ou une erreur est survenue lors de lexcution. Substatus : Explications dtailles propos des assertions de statut. Les explications peuvent tre : - Test logically failed : le Job analys ne produit pas le rsultat attendu. - Execution Error : une erreur dexcution est survenue lors de lexcution. Description : La description textuelle que vous avez saisie dans le tAssert. Catch Java Exception Catch tAssert Cette case, une fois coche, vous permet de capturer les erreurs dexception Java. Cette case vous permet de capturer les assertions du tAssert.

1378

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Utilisation

Ce composant est un composant de dbut de Job secondaire qui retrouve les informations de statut dexcution partir de diffrentes sources. Il gnre un flux de donnes afin de transfrer les informations au composant suivant. Ce composant doit tre utilis avec le composant tAssert.

Limitation

Scnario associ
Pour un scnario associ, consultez le scnario du tAssert : la section intitule Scnario : Paramtrer une condition assertive pour lexcution dun Job

Guide de Rfrence des Composants Talend Open Studio

1379

tChronometerStart

tChronometerStart

Proprits du tChronometerStart
Famille de composant Fonction Objectif Logs & Errors Le composant tChronometerStart dmarre lopration de mesure du temps dexcution dun sous-Job. Le tChronometerStart fonctionne comme un chronomtre : le composant commence calculer soit le temps de traitement dun ou plusieurs sous-Jobs du Job principal, soit le temps de traitement dune partie dun sous-Job. Vous pouvez utiliser le tChronometerStart comme composant de dbut ou au milieu dun Job. Il peut prcder une ou plusieurs tches de traitement dans un sous-Job. Il peut galement prcder un ou plusieurs sous-Jobs dans le Job principal. n/a

Utilisation

Limitation

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Mesurer la dure de traitement dun sous-Job ou dune partie dun sous-Job .

1380

Guide de Rfrence des Composants Talend Open Studio

tChronometerStop

tChronometerStop

Proprits du tChronometerStop
Famille de composant Fonction Objectif Logs & Errors Le composant tChronometerStop mesure le temps dexcution dun sous-Job. Le tChronometerStop fonctionne comme un chronomtre : Il affiche le temps dexcution total et arrte le calcul du temps de traitement soit dun ou de plusieurs sous-Jobs dans le Job principal, soit dune partie dun sous-Job. Since options Cochez lune des deux cases pour choisir le point de dpart du processus de mesure : Since the beginning : arrte le calcul du temps dont la mesure a commenc au dbut dun sous-Job. Since a tChronometerStart : arrte le calcul du temps dont la mesure a commenc partir dun composant tChronometerStart utilis sur le flux de donnes du sous-Job. Display console Display name Caption Display human dable duration Utilisation Limitation duration in Cochez cette case pour afficher les informations dexcution du sous-Job sur la console.

Basic settings

component Cochez cette case pour afficher le nom des composants sur la console. Entrez un texte, pour permettre didentifier votre sousJob par exemple. rea- Cochez cette case pour afficher les informations dexcution du sous-Job en units de temps exploitables.

Ne peut tre utilis comme composant de dbut. n/a

Scnario : Mesurer la dure de traitement dun sousJob ou dune partie dun sous-Job
Ce scnario est un sous-Job, qui, dans une squence, effectue les oprations suivantes : gnre 1 000 000 lignes de noms et de prnoms ; regroupe les noms et les prnoms correspondants ; stocke les donnes de sortie dans un fichier dlimit ; mesure la dure densemble du sous-Job ; mesure la dure de lopration de remplacement des noms,

Guide de Rfrence des Composants Talend Open Studio

1381

Scnario : Mesurer la dure de traitement dun sous-Job ou dune partie dun sous-Job

affiche les informations relatives au temps de traitement dans la console de log Run. Pour mesurer le temps dexcution du sous-Job : A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : le tRowGenerator, le tMap, le tFileOutputDelimited et le tChronometerStop. Reliez les trois premiers composants laide de liens de type Main Row. Lorsque vous reliez le tMap au tFileOutputDelimited, vous serez invits donner un nom la table en sortie. Le nom utilis dans cet exemple est new_order.

Reliez le tFileOutputDelimited au tChronometerStop laide dun lien de type OnComponentOk. Slectionnez le tRowGenerator puis cliquez sur la vue Component pour paramtrer ses proprits de base, dfinies par dfaut, dans longlet Basic settings.

Cliquez sur le bouton [...] du champ Edit schema pour dfinir le schma du tRowGenerator. Cliquez deux fois sur le bouton [+] pour ajouter deux colonnes : First_Name et Last_Name. Cliquez sur OK afin de fermer la bote de dialogue. Cliquez sur le bouton [...] du champ RowGenerator Editor pour ouvrir lditeur et dfinir les donnes gnrer.

Dans le champ Number of Rows for RowGenerator de lditeur [RowGenerator Editor], prcisez le nombre de lignes gnrer puis cliquez sur OK. Lditeur [RowGenerator Editor] se ferme. Une bote de dialogue souvre et vous demande si vous souhaitez propager les changements. Cliquez sur Yes (Oui).

1382

Guide de Rfrence des Composants Talend Open Studio

Scnario : Mesurer la dure de traitement dun sous-Job ou dune partie dun sous-Job

Double-cliquez sur le composant tMap pour ouvrir son diteur. Lditeur du tMap affiche le schma du component tRowGenerator.

Dans longlet Schema editor de lditeur du tMap, cliquez sur le bouton [+] de la table de sortie pour ajouter deux lignes puis configurez-les. Dans lditeur du tMap, glissez la ligne First_Name de la table dentre dans la ligne Last_Name de la table de sortie et glissez la ligne Last_Name dans la ligne First_Name de la table de sortie. Cliquez sur Apply pour enregistrer les modifications. A nouveau, une bote de dialogue souvre et vous demande si vous souhaitez propager les changements. Cliquez sur Yes. Cliquez sur OK pour fermer lditeur.

Slectionnez le tFileOutputDelimited et cliquez sur la vue Component pour paramtrer ses proprits de base dans longlet Basic settings :

Guide de Rfrence des Composants Talend Open Studio

1383

Scnario : Mesurer la dure de traitement dun sous-Job ou dune partie dun sous-Job

Slectionnez le tChronometerStop et cliquez sur la vue Component pour paramtrer ses proprits de base dans longlet Basic settings. Dans la zone Since options, cochez loption Since the beginning pour mesurer la dure dexcution du sousJob entier. t

Cochez/dcochez les autres cases en fonction de vos besoins. Dans ce scnario, lobjectif est dafficher dans la console la dure dexcution du sous-Job, prcde du nom du composant. Si ncessaire, saisissez du texte de le champ Caption. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Vous pouvez aussi mesurer la dure du sous-Job en plaant un tChronometerStop en dessous du tRowGenerator, et en les connectant via un lien OnSubJobOk.

1384

Guide de Rfrence des Composants Talend Open Studio

tDie

tDie

Proprits du tDie
Les composants tDie et tWarn sont troitements lis au composant tLogCatcher. Ils sont gnralement utiliss ensemble afin que les donnes de log collectes par le tLogCatcher soient rassembles et envoyes vers la sortie dfinie. Famille de composant Fonction Objectif Basic settings Logs & Errors Le composant tDie tue le Job en cours dexcution. Il est gnralement utilis avec un composant tCatch afin de collecter des donnes de log. Ce composant dclenche le composant tLogCatcher afin de collecter des donnes de log exhaustives avant de tuer le Job. Die message Error code Priority Utilisation Limitation n/a Saisissez le message qui sera affich avant que le Job ne soit tu. Saisissez le code de lerreur (un entier) si ncessaire. Slectionnez le niveau de priorit.

Ce composant ne peut tre utilis en tant que composant de dbut.

Scnarios associs
Pour des exemples dutilisation du composant tDie, consultez les scnarios du composant tLogCatcher : la section intitule Scnario 1 : Avertissement & log lors de la cration dentres la section intitule Scnario 2 : Monitorer & arrter un Job

Guide de Rfrence des Composants Talend Open Studio

1385

tFlowMeter

tFlowMeter

Proprits du tFlowMeter
Famille de composant Fonction Objectif Basic settings Logs & Errors Le composant tFlowMeter compte le nombre de lignes traites dans le flux spcifi. Le nombre de lignes est ensuite rcupr par le composant tFlowMeterCatcher afin dtre ajout dans les donnes de log. Use input connection Cochez cette case pour rutiliser le nom donn au flux name as label dentre Main Row comme libell des donnes logge. Mode Slectionnez le type de valeur des donnes mesures : Absolute : le nombre actuel de lignes est logg. Relative : un pourcentage (%) du nombre de lignes est logg. Lorsque cette option est slectionne, la liste Connections List vous permet de slectionner une connexion de rfrence. Thresholds Ajoutez un seuil pour observer les proportions en volumes mesurs. Vous pouvez dcider que le flux doit tre compris entre un nombre minimum et maximum de lignes, et si le flux est infrieur au seuil minimum, il y a un goulot dtranglement.

Utilisation Limitation

Ce composant ne peut tre utilis comme composant de dbut puisquil ncessite un flux dentre pour fonctionner. n/a

Si vous avez besoin dutiliser les donnes de log, les statistiques et tout autre mesure des flux de donnes, consultez le Guide utilisateur de Talend Open Studio.

Scnario associ
Pour plus dinformations sur lutilisation du tFlowMeter, consultez la section intitule Scnario : Mesurer le flux dun Job

1386

Guide de Rfrence des Composants Talend Open Studio

tFlowMeterCatcher

tFlowMeterCatcher

Proprits du tFlowMeterCatcher
Famille de composant Fonction Objectif Basic settings Logs & Errors Le composant tFlowMeterCatcher est bas sur le schma dfini. Il rcupre les donnes du composant tFlowMeter et les transmet au composant de sortie. Ce composant fonctionne comme une fonction de log dclenche par lutilisation du composant tFlowMeter dans le Job. Schema Un schma est une description de lignes, i.e., il dfinit les champs traiter et passer au composant suivant. Pour ce composant, le schma est en lecture seule puisquil regroupe les informations de log standard, notamment : Moment : Date et heure du traitement Pid : Identifiant systme du Job. Father_pid : Identifiant systme du Job parent, le cas chant. Sinon, le Pid est dupliqu. Root_pid : Identifiant systme du Job racine, le cas chant. Sinon, le Pid est dupliqu. System_pid : Identifiant systme gnr par le systme. Project : Nom du projet auquel appartient le Job. Job : Nom du Job en cours. Job_repository_id lapplication. : Identifiant gnr par

Job_version : Numro de version du Job en cours. Context : Nom du contexte en cours. Origin : Nom du composant, le cas chant. Label : Libell de la connexion main Row prcdent le composant tFlowMeter dans le Job et dont la volumtrie sera analyse. Count : Nombre de lignes en cours de traitement. Reference : Nombre de lignes passant dans le lien Reference. Thresholds : cette fonction ne sutilise que si le mode Relative a t slectionn dans le composant tFlowMeter. Utilisation Limitation Ce composant est le composant de dbut du Job secondaire qui se dclenche automatiquement la fin du Job principal. Lutilisation de ce composant est lie lutilisation du composant tFlowMeter. Pour plus dinformations, consultez la section intitule tFlowMeterCatcher .

Guide de Rfrence des Composants Talend Open Studio

1387

Scnario : Mesurer le flux dun Job

Scnario : Mesurer le flux dun Job


Le Job suivant permet de recueillir le nombre de lignes traites. Les mesures sont prises deux fois, une fois aprs le composant dentre, cest--dire avant quelles soient filtres, et aprs leur filtrage, avant le composant de sortie.

Cliquez et dposez les composants suivants : tMysqlInput, tFlowMeter (x2), tMap, tLogRow, tFlowMeterCatcher et tFileOutputDelimited. Connectez les composants du Job principal laide de liens de type Row main et cliquez sur le libell pour lui donner un nom plus parlant, par exemple US_States aprs le composant dentre et filtered_states aprs le tMap. Reliez aussi les composants tFlowMeterCatcher et tFileOutputCSV laide dune connexion de type Row main puisque les donnes sont transmises au composant de sortie. Dans la vue Component du composant tMysqlInput, slectionnez loption Repository dans le champ Property Type, si les proprits de connexion la base de donnes sont stockes dans une mtadonne du Repository. Sinon, slectionnez loption Built-in et paramtrez les proprits et le schma manuellement.

Les 50 Etats des Etats-Unis sont enregistrs dans la table states. Pour que les 50 entres soient slectionnes, la requte effectuer dans la base de donnes Mysql est la suivante : select * from states. Dans longlet Advanced settings, slectionnez lencodage adquat. Puis slectionnez le composant suivant, le tFlowMeter, et paramtrez ses proprits.

1388

Guide de Rfrence des Composants Talend Open Studio

Scnario : Mesurer le flux dun Job

Cochez la case Use input connection name as label pour rutiliser le nom de la connexion dentre dans le fichier log de sortie (tFileOutputCSV). Dans le champ Mode, slectionnez loption Absolute puisquil ny a pas de flux de rfrence, et aucun seuil ne doit tre dfini dans le champ Threshold pour cet exemple. Les informations du champ Thresholds sont utilises dans un outil de monitoring tel que lActivity Monitoring Console de Talend afin dobtenir une reprsentation proportionnelle du flux trait. Pour plus dinformations, consultez le Guide utilisateur de lActivity Monitoring Console. Puis lancez lditeur du tMap pour paramtrer les proprits de filtrage. Pour cet exemple, glissez et dposez les colonnes ID et State de la zone Input ( gauche) du tMap vers la zone Output ( droite). Aucune variable nest utilise pour cet exemple.

Dans la table du flux de sortie (ici, la table filtered_states), cliquez sur la flche dote dun (+) pour ajouter un ligne de filtre. Glissez la colonne State de la zone Input (row2) vers le champ filtre et saisissez un filtre permettant de nobtenir que les Etats commenant par la lettre M. Lexpression finale ressemble : row2.State.startsWith("M") Cliquez sur OK pour valider les paramtres. Puis slectionnez le deuxime composant tFlowMeter et paramtrez ses proprits.

Guide de Rfrence des Composants Talend Open Studio

1389

Scnario : Mesurer le flux dun Job

Cochez la case Use input connection name as label. Dans le champ Mode, slectionnez loption Relative et dans la liste droulante Reference connection, slectionnez US_States comme rfrence. Une fois de plus, aucun seuil nest utilis pour cet exemple, ainsi laissez le champ Threshold vide. Aucun paramtre particulier nest requis pour le composant tLogRow. Il en va de mme pour le composant tFlowMeterCatcher puisque ses proprits sont limites au schma prdfini contenant les informations de log. Paramtrez les proprits du composant de sortie (tFileOutputCSV).

Cochez la case Append pour logger toutes les mesures du tFlowMeter. Enregistrez le Job et excutez-le.

1390

Guide de Rfrence des Composants Talend Open Studio

Scnario : Mesurer le flux dun Job

La vue Run affiche le nom des Etats filtrs tel quil a t dfini dans le Job.

Dans le fichier csv dlimit, le nombre de lignes de la colonne count varie entre le composant tFlowMeter1 et le tFlowMeter2 puisque les donnes ont t filtres. La colonne reference affiche cette diffrence.

Guide de Rfrence des Composants Talend Open Studio

1391

tLogCatcher

tLogCatcher

Proprits du tLogCatcher
Les composants tDie et tWarn sont troitements lis au composant tLogCatcher. Ils sont gnralement utiliss ensemble afin que les donnes de log collectes par le tLogCatcher soient rassembles et envoyes vers la sortie dfinie. Famille de composant Fonction Logs & Errors Le composant tLogCatcher rcupre les champs et les messages des fonctions Java Exception et des composants tDie et/ou tWarn et les transmet au composant suivant. Ce composant fonctionne comme une fonction de log dclenche par une des trois fonctions suivantes : Java exception, tDie ou tWarn, pour collecter et transfrer des donnes de log. Schema type et Edit Un schma est une description de lignes, i.e., il dfinit Schema le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement leGuide utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Catch Java Exception Cochez cette case pour dclencher la fonction tCatch lorsque la fonction Java Exception est appele dans le Job. Cochez cette case pour dclencher la fonction tCatch lorsque le composant tDie est appel dans le Job. Cochez cette case pour dclencher la fonction tCatch lorsque le composant tWarn est appel dans le Job.

Objectif

Basic settings

Catch tDie Catch tWarn Utilisation Limitation

Ce composant est le composant de dbut dun Job secondaire qui se dclenche automatiquement la fin du Job principal. n/a

Scnario 1 : Avertissement & log lors de la cration dentres


Dans ce scnario constitu de trois composants, un composant tRowGenerator cre des donnes alatoires (des id incrmenter). Le flux dentre atteint le composant tWarn qui dclenche le sous-Job commenant par le tLogCatcher. Ce sous-Job rcupre le message davertissement ainsi que les informations standard et les transmet au tLogRow afin dafficher les donnes de log.

1392

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Avertissement & log lors de la cration dentres

Cliquez et dposez les composants tRowGenerator, tWarn, tLogCatcher et tLogRow dans lespace de modlisation. Connectez les composants tRowGenerator et tWarn. Connectez les composants tLogCatcher et tLogRow sparement. Dans lditeur du tRowGenerator, paramtrez la cration des donnes alatoires laide de fonction de base :

Dans la vue Component du composant tWarn, paramtrez le message davertissement dans le champ Warn message, le code et le niveau de priorit dans le champ Priority. Pour cet exemple, le message est this is a warning. Pour ce scnario, concatnez le message ci-dessus avec une fonction pour collecter la premire valeur de la table Input.

Dans la vue Component du composant tLogCatcher, cochez la case tWarn pour que le message dfini dans le tWarn soit rcupr par le sous-Job. Cliquez sur Edit Schema pour vrifier le schma utilis pour la sortie de log. Notez que le log est complet.

Guide de Rfrence des Composants Talend Open Studio

1393

Scnario 2 : Monitorer & arrter un Job

Appuyez sur F6 pour excuter le Job. Notez que le Log produit est exhaustif.

Scnario 2 : Monitorer & arrter un Job


Ce scnario utilise les composants tLogCatcher et tDie. Un composant tRowGenerator est connect un composant tFileOutputDelimited laide dun lien Row. Lorsquune erreur survient, le composant tDie dclenche le sous-Job contenant le tLogCatcher qui affiche les donnes de log dans la console Run.

Cliquez et dposez les composants ncessaires de la Palette : tRowGenerator, tFileOutputDelimited, tDie, tLogCatcher, tLogRow. Dans la vue Component du composant tRowGenerator, paramtrez les proprits des donnes dentre qui seront traites.

Editez le schma et paramtrez les colonnes suivantes : id, name, quantity, flag et creation. Dans le champ Number of rows, saisissez 0. Cela consituera lerreur sur laquelle sera base opration Die. Dans la colonne Values, dfinissez les fonctions permettant dalimenter le flux dentre. Paramtrez les proprits du tFileOutputDelimited afin quil contienne les donnes transmises. La connexion Row provenant du tRowGenerator alimente automatiquement le schma du tFileOutputDelimited. Dans le champ Row separator, saisissez un point-virgule comme sparateur de champ. Connectez le composant de sortie au tDie laide dun lien Trigger > If. Double-cliquez sur cette nouvelle connexion et paramtrez le if : ((Integer)globalMap.get("tRowGenerator_1_NB_LINE")) <=0 Puis double-cliquez pour slectionner et paramtrer les proprits du composant tDie dans longlet Basic settings.

1394

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Monitorer & arrter un Job

Dans le champ Die message, saisissez le message transmettre au tLogCatcher avant que le Job ne soit arrt par la fonction Kill. Dans le mme Job, cliquez et dposez un tLogCatcher, sans pour autant le connecter aux composants prcdents, et connectez-le un composant tLogRow. Dans longlet Basic settings du composant tLogCatcher, paramtrez ses proprits. Assurez-vous que la case tDie est bien coche pour pouvoir ajouter un message Die aux informations de Log transmises au composant final.

Appuyez sur F6 pour excuter le Job et notez que le log contient un message en noir et un en rouge. Les donnes de log en noir proviennent du tDie et sont transmises par le tLogCatcher. Et le message Java Exception en rouge apparat puisque le Job sest arrt.

Guide de Rfrence des Composants Talend Open Studio

1395

tLogRow

tLogRow

Proprits du tLogRow
Famille de composant Fonction Objectif Basic settings Logs & Errors Le composant tLogRow affiche les donnes ou les rsultats dans la console Run. Ce composant permet de monitorer les donnes traites. Print values in table Le flux de sortie apparat dans un tableau. cells Separator Saisissez le sparateur qui dlimitera les donnes dans la console.

Print component unique Cochez cette case si plusieurs composants tLogRow name in front of each sont utiliss. Cela permet de diffrencier les sorties. output row Print schema column Cochez cette case pour rcuprer les libells des coname in front of each lonnes du schma de sortie. value Use fixed length for va- Cochez cette case pour paramtrer une largeur fixe aux lues valeurs affiches. Utilisation Limitation Ce composant peut tre utilis en composant intermdiaire dans un flux de donnes ou en composant de fin dans un Job design. n/a

Scnarios associs
Pour plus dinformations sur lutilisation du tLogRow, consultez les composants : tFileInputDelimited, la section intitule Scnario : Lire les donnes matre dun hub MDM . tContextLoad, la section intitule Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL . tWarn, tDie et tLogCatcher, la section intitule Scnario 1 : Avertissement & log lors de la cration dentres et la section intitule Scnario 2 : Monitorer & arrter un Job .

1396

Guide de Rfrence des Composants Talend Open Studio

tStatCatcher

tStatCatcher

Proprits du tStatCatcher
Famille de composant Fonction Logs & Errors Le composant tStatCatcher est bas sur le schma dfini et regroupe les mtadonnes du Job en cours dexcution, ainsi que les mtadonnes de chaque composant de ce Job. Ce composant fonctionne comme une fonction de log dclenche pour chaque composant dont la case StatsCatcher Statistics est coche. Il collecte et transfert ces donnes de log la sortie dfinie. Schema type Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Pour ce composant, le schma est en lecture seule, puisquil regroupe les informations de log standard, notamment : Moment : Date et heure du traitement Pid : Identifiant systme du Job. Father_pid : Identifiant systme du Job parent, le cas chant. Sinon, le Pid est dupliqu. Root_pid : Identifiant systme du Job racine, le cas chant. Sinon, le Pid est dupliqu. Project : Nom du projet auquel appartient le Job. Job : Nom du Job en cours. Context : Nom du contexte en cours. Origin : Nom du composant, le cas chant. Message : Informations de dbut et de fin du Job. Utilisation Ce composant est le composant de dbut dun Job secondaire qui se dclenche automatiquement la fin du Job principal. Les dates de dbut et de fin apparaissent dans le log. n/a

Objectif

Basic settings

Limitation

Scnario : Afficher les statistiques du Job


Ce scnario dcrit un Job quatre composants, permettant dafficher dans la console Run les statistiques recueillies lors de la gnration du fichier grce au composant tStatCatcher.

Guide de Rfrence des Composants Talend Open Studio

1397

Scnario : Afficher les statistiques du Job

Cliquez et dposez les composants : tRowGenerator, tFileOutputDelimited, tStatCatcher et tLogRow Dans longlet Basic settings du composant tRowGenerator, paramtrez les donnes gnrer. Pour ce Job, le schma est compos de trois colonnes : ID_Owners, Name_Customer et ID_Insurance

Le nombre de lignes peut tre limit 100. Cliquez sur longlet Main de la vue Component.

Et cochez la case tStatCatcher Statistics pour activer la fonction de rcupration des statistiques. Puis, paramtrez les proprits du composant de sortie. Dans la vue Component du tFileOutputDelimited, slectionnez le fichier de sortie ou saisissez le nom du fichier de sortie crer. Paramtrez les sparateurs de champs (point-virgule) et lencodage. Cliquez sur Edit schema et assurez-vous que le schma est rcupr du schma dentre. Si ncessaire, cliquez sur Sync Columns pour rcuprer le schma du composant prcdent. Puis cliquez sur longlet Advanced settings de la vue Component, et cochez la case tStatCatcher Statistics pour activer la fonction de rcupration des statistiques.

1398

Guide de Rfrence des Composants Talend Open Studio

Scnario : Afficher les statistiques du Job

Dans le deuxime Job, double-cliquez sur le composant tStatCatcher. Notez que les proprits sont fournis uniquement pour information puisque le schma reprsentant les donnes regrouper et agrger en statistiques, est en lecture seule.

Paramtrez ensuite les proprits du tLogRow. Dfinissez le sparateur de donnes qui apparatra dans la console. Enfin, appuyez sur F6 pour excuter le Job et afficher les rsultats du Job.

Les donnes de log affiche les informations de dbut et de fin du Job en lui-mme, ainsi que pour chaque composant.

Guide de Rfrence des Composants Talend Open Studio

1399

tWarn

tWarn

Proprits du tWarn
Les composants tDie et tWarn sont troitement lis au composant tLogCatcher. Ils sont gnralement utiliss ensemble afin que les donnes de log collectes par le tLogCatcher soient rassembles et envoyes vers la sortie dfinie. Famille de composant Fonction Objectif Basic settings Logs & Errors Le composant tWarn envoie un message davertissement au composant suivant. Ce composant dclenche un avertissement souvent pris comme donnes de log exhaustives par le composant tLogCatcher. Warn message Code Priority Utilisation Saisissez votre message davertissement. Saisissez le niveau de code. Slectionnez le niveau de priorit.

Ce composant ne peut tre utilis comme composant de dbut. Ainsi, sil est connect un composant de sortie, il doit aussi tre connect un composant dentre. n/a

Limitation

Scnarios associs
Pour des exemples dutilisation du tWarn, consultez les scnarios du composant tLogCatcher : la section intitule Scnario 1 : Avertissement & log lors de la cration dentres la section intitule Scnario 2 : Monitorer & arrter un Job

1400

Guide de Rfrence des Composants Talend Open Studio

Composants Misc
Ce chapitre passe en revue les principaux composants prsents dans la famille Misc de la Palette de Talend Open Studio. La famille Misc regroupe divers connecteurs permettant de rpondre des besoins, tels que la cration de lignes de donnes factices, la mise en tampon de donnes, le chargement de variables de contexte.

Guide de Rfrence des Composants Talend Open Studio

tAddLocationFromIP

tAddLocationFromIP

Proprits du tAddLocationFromIP
Famille du composant Fonction Objectif Misc Le composant tAddLocationFromIP remplace des adresses IP par le lieu gographique correspondant. Le tAddLocationFromIP vous permet de localiser gographiquement les visiteurs grce leurs adresses IP : il identifie le lieu gographique des visiteurs (pays, rgion, ville, latitude, longitude, code postal, etc.) en utilisant un fichier de consultation dadresse IP. Schema type et Un schma est une description de lignes, i.e., il dfinit le Edit Schema nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Database path File- Chemin daccs au fichier de consultation dadresses IP.

Basic settings

Input parameters Input column : Slectionnez la colonne dentre partir de laquelle les valeurs sont collectes pour lagrgation. input value is a hostname : Cochez cette case si la colonne dentre comporte des noms dhtes. input value is an IP address : Cochez cette case si la colonne dentre comporte des adresses IP. Location type Country code : Cochez cette case pour remplacer ladresse IP par le code du pays correspondant. Country name : Cochez cette case pour remplacer ladresse IP par le nom du pays correspondant. Utilisation Ce composant peut tre utilis comme tape intermdiaire du traitement permettant de remplacer des adresses IP par des informations golocalises. Il ne peut tre utilis comme composant de dbut car il ncessite un flux en entre, ainsi quun composant de sortie. n/a

Limitation

1402

Guide de Rfrence des Composants Talend Open Studio

Scnario : Identifier la localisation gographique dune adresse IP

Scnario : Identifier la localisation gographique dune adresse IP


Le scnario Java suivant cre un Job trois composants associant une adresse IP un lieu gographique. Il permet dobtenir la localisation gographique du visiteur dun site partir de son adresse IP. A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : le tFixedFlowInput, le tAddLocationFromIP, et le tLogRow. Connectez les trois composants en utilisant des liens de type Row Main.

Dans lespace graphique, slectionnez le tFixedFlowInput. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFixedFlowInput. Configurez le champ Schema Type en mode Built-In puis cliquez sur le bouton [...] ct du champ Edit Schema pour dfinir les donnes que vous voulez utiliser en entre. Dans ce scnario, le schma est constitu dune colonne comportant une adresse IP.

Cliquez sur le bouton OK pour fermer la bote de dialogue, puis acceptez la propagation des modifications lorsque le systme vous invite le faire. La colonne dfinie saffiche dans la section Values de la vue Basic settings. Cliquez dans la cellule Value puis dfinissez la valeur de ladresse IP.

Dans le champ Number of rows, entrez le nombre de lignes gnrer. Dans lespace graphique, slectionnez le composant tAddLocationFromIP.

Guide de Rfrence des Composants Talend Open Studio

1403

Scnario : Identifier la localisation gographique dune adresse IP

Cliquez dans la vue Component pour dfinir la configuration de base (Basic settings) du tAddLocationFromIP.

Cliquez sur le bouton Sync columns pour synchroniser le schma avec le schma dentre du tFixedFlowInput. Parcourez vos dossiers jusquau fichier GeoIP.dat pour en dfinir le chemin daccs dans le champ Database filepath. Assurez-vous de tlcharger la dernire version du fichier de consultation des adresses IP, partir du site indiqu dans la vue Basic settings du composant tAddLocationFromIp. Dans la zone Input parameters, dfinissez les paramtres dentre selon vos besoins. Dans ce scnario, la colonne dentre correspond la colonne ip, qui comporte une adresse IP, dfinie prcdemment. Dans la zone Location type, dfinissez le type de lieu selon vos besoins. Dans ce scnario, on veut afficher le nom du pays. Dans lditeur graphique, slectionnez le composant tLogRow. Cliquez sur la vue Component puis dfinissez la configuration de base (Basic settings) du tLogRow selon vos besoins. Dans ce scnario, on veut afficher les valeurs dans les cellules dune table. Enregistrez votre Job puis cliquez sur F6 pour lexcuter.

La ligne unique gnre par le Job affiche le nom du pays correspondant ladresse IP renseigne.

1404

Guide de Rfrence des Composants Talend Open Studio

tBufferInput

tBufferInput

Proprits du tBufferInput
Famille de composant Fonction Objectif Misc Ce composant permet de rcuprer les donnes mises en tampon pour pouvoir les rutiliser dans un deuxime sous-job. Le composant tBufferInput rcupre les donnes mises en mmoire tampon, via un composant tBufferOutput par exemple, pour les traiter dans un deuxime temps. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Lors de lutilisation du tBufferInput, cest lordre des colonnes qui est pris en compte, ainsi lordre des colonnes est plus important que leur libell. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Utilisation Ce composant est le composant de dbut dun Job secondaire qui se dclenche automatiquement la fin du Job principal.

Basic settings

Scnario : Rcuprer les donnes mises en tampon


Ce scnario dcrit un Job qui rcupre les donnes mises en mmoire tampon lors de lexcution dun premier sous-job et les affiche dans la console standard.

Guide de Rfrence des Composants Talend Open Studio

1405

Scnario : Rcuprer les donnes mises en tampon

Cliquez et dposez les composants suivants : tFileInputDelimited et tBufferOutput. Slectionnez le composant tFileInputDelimited et dans longlet Basic Settings de la vue Component, paramtrez les proprits daccs au fichier dentre.

Dans le champ File Name, paramtrez le chemin daccs au fichier dlimit contenant les donnes mettre en tampon. Dans les champs Row et Field separators, renseignez respectivement les sparateurs de lignes et de champs. Dans le champ Header, renseignez les informations sur un ventuel en-tte. Cliquez sur le bouton [...] cot du champ Schema type pour dcrire la structure du fichier

Dcrivez le Schma des donnes passer au composant tBufferOutput. Slectionnez le composant tBufferOutput et paramtrez ses proprits dans longlet Basic Settings de la vue Component.

Gnralement le schma du composant dentre alimente automatiquement le schma du composant tBufferOutput. Mais vous pouvez aussi configurer une partie du schma mettre en tampon si vous le souhaitez. Dposez les composants tBufferInput et tLogRow en dessous du sous-job que vous venez de crer. Reliez le composant tFileInputDelimited au tBufferInput via un lien de type Trigger > OnSubjobOk et reliez le composant tBufferInput au tLogRow via un lien de type Row > Main. Double-cliquez sur le composant tBufferInput pour paramtrer ses proprits dans la vue Component. Dans longlet Basic settings, cliquez sur le bouton [...] ct du champ Schema pour dcrire la structure du fichier.

Utilisez la mme description de fichier que celle dfinie pour le composant tFileInputDelimited et cliquez sur OK.

1406

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer les donnes mises en tampon

Le schma du composant tBufferInput alimente automatiquement le schma du composant tLogRow. Sinon double-cliquez sur le tLogRow pour afficher ses proprits dans la vue Component et cliquez sur le bouton Sync columns. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

La console affiche les donnes qui ont t rcuprs de la mmoire tampon.

Guide de Rfrence des Composants Talend Open Studio

1407

tBufferOutput

tBufferOutput

Proprits du tBufferOutput
Famille de composant Fonction Objectif Misc Ce composant met en tampon des donnes afin de pouvoir y accder plus tard via un service Web par exemple. Ce composant permet daccder aux donnes via un service Web. En effet, il a t conu pour tre export en tant que service Web afin daccder aux donnes directement partir du serveur dapplication Web. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Lors de lutilisation du tBufferOutput, cest lordre des colonnes qui est pris en compte, ainsi lordre des colonnes est plus important que leur libell. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Utilisation Ce composant nest pas un composant de dbut (font vert) et il requiert un composant de sortie.

Basic settings

Scnario 1 : Mettre des donnes en tampon


Ce scnario dcrit un Job volontairement basique qui met en tampon les donnes dun Job enfant pendant quun Job parent affiche les donnes mise en tampon dans la console standard. Gnralement, un Job utilisant un composant tBufferOutput inclurait une tape dexport en tant que service Web, afin que les donnes soient accessibles directement via le serveur dapplication Web.

1408

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Mettre des donnes en tampon

Crez deux Jobs : le premier Job (BufferFatherJob) excute le deuxime et affiche le contenu dans la console Run. Le deuxime Job (BufferChildJob) stocke les donnes dfinies dans une mmoire tampon. Dans le premier Job, cliquez et dposez les composants suivants : tRunJob et tLogRow. Dans le deuxime Job, cliquez et dposez les composants suivants : tFileInputDelimited et tBufferOutput. Commencez par paramtrer les proprits du deuxime Job. Slectionnez le composant tFileInputDelimited et dans longlet Basic Settings de la vue Component, paramtrez les proprits daccs au fichier dentre.

Dans le champ File Name, paramtrez le chemin daccs au fichier dlimit contenant les donnes mettre en tampon. Dans les champs Row et Field separators, renseignez respectivement les sparateurs de lignes et de champs. Dans le champ Header, renseignez les informations sur un ventuel en-tte.

Dcrivez le Schma des donnes passer au composant tBufferOutput. Slectionnez le composant tBufferOutput et paramtrez ses proprits dans longlet Basic Settings de la vue Component.

Guide de Rfrence des Composants Talend Open Studio

1409

Scnario 2 : Mettre les donnes de sortie en mmoire tampon du serveur dapplication Web

Gnralement le schma du composant dentre alimente automatiquement le schma du composant tBufferOutput. Mais vous pouvez aussi configurer une partie du schma mettre en tampon si vous le souhaitez. Maintenant le premier Job (BufferFatherJob), paramtrez les proprits du composant tRunJob.

Cliquez sur Edit schema pour modifier le schma si ncessaire et slectionner la colonne afficher. Le schma peut tre identique ou diffrent du schma mis en tampon. Dans le tableau Context Param, vous pouvez aussi dfinir les paramtres de contexte utiliser pour lexcution de ce Job. Pour cet exemple, gardez le contexte par dfaut. Appuyez sur F6 pour excuter les Jobs parent. Le composant tRunJob se charge dexcuter le Job enfant et affiche les donnes dans la console standard :

Scnario 2 : Mettre les donnes de sortie en mmoire tampon du serveur dapplication Web
Ce scnario dcrit un Job appelant un service Web et stockant les donnes de sortie directement sur la mmoire tampon du serveur dapplication Web. Ce scnario cre dabord un Job utilisant des variables de contexte qui pourra ensuite tre utilis en tant que service Web, puis exporte de Job en tant que service Web. Crer un Job utilisant des variables de contexte et pouvant tre export en tant que service Web :

1410

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Mettre les donnes de sortie en mmoire tampon du serveur dapplication Web

Cliquez-dposez les composants suivants dans le Job Designer : tFixedFlowInput et tBufferOutput. Reliez-les via une connexion de type Row Main.

Dans lespace de travail, slectionnez le tFixedFlowInput. Cliquez sur la vue Component pour paramtrer ses proprits de base dans longlet Basic settings. Dans la liste Schema Type, slectionnez Built-In et cliquez sur le bouton [...] cot du champ Edit Schema pour dcrire la structure des donnes que vous souhaitez partir des variables internes. Dans ce scnario, le schma est constitu de trois colonnes : now, firstname, et lastname.

Cliquez trois fois sur le bouton [+] pour ajouter trois lignes de paramtre et configurez vos variables. Cliquez sur OK pour fermer la bote de dialogue et acceptez la propagation des modifications lorsque vous y tes invit. Les trois colonnes dfinies apparaissent dans le champ Values de longlet Basic settings du tFixedFlowInput.

Cliquez dans le cellule Value de chaque ligne des deux premier paramtres dfinis et appuyez sur Ctrl+Espace pour accder la liste des variables globales. A partir de la liste des variables globales, slectionnez TalendDate.getCurrentDate() pour la colonne now et talendDatagenerator.getFirstName pour la colonne firstname. Pour ce scnario, lobjectif est de dfinir deux variables de contexte : nb_lines et lastname. Dans la premire, paramtrez le nombre de lignes gnrer, et dans le deuxime, paramtrez les noms qui apparaitront dans la liste

Guide de Rfrence des Composants Talend Open Studio

1411

Scnario 2 : Mettre les donnes de sortie en mmoire tampon du serveur dapplication Web

de sortie. Le composant tFixedFlowInput gnrera le nombre de lignes et les trois colonnes : now, firstname, et lastname dfinies dans les variables de contexte. Pour plus dinformations concernant lutilisation des variables de contexte : consultez le Guide utilisateur de Talend Open Studio. Pour dfinir les deux variables de contexte : Slectionnez le composant tFixedFlowInput et cliquez sur la vue Contexts. Dans la vue Variables, cliquez sur le bouton [+] pour ajouter deux lignes de paramtres et configurez-les.

Cliquez sur longlet Values as table et configurez le premier paramtre dfinissant le nombre de lignes gnrer et le second paramtre dfinissant les noms afficher.

Cliquez sur la vue Component pour afficher longlet Basic settings du composant tFixedFlowInput. Cliquez dans la cellule Value de la colonne lastname et appuyez sur Ctrl+Space pour accder la liste des variables globales. A partir de la liste des variables globales, slectionnez context.lastname, la variable de contexte que vous avez cr pour la colonne lastname.

Exporter un Job en tant que service Web : Avant dexporter votre Job en tant que service Web, consultez le Guide utilisateur de Talend Open Studio.

1412

Guide de Rfrence des Composants Talend Open Studio

Scnario 3 : Appeler un Job contenant des variables de contexte partir de votre navigateur Web

Dans la vue Repository, cliquez-droit sur le Job que vous venez de crer et slectionnez Export Job Scripts dans le menu. La bote de dialogue [Export Job Scripts] souvre.

Cliquez sur le bouton Browse... et slectionnez le rpertoire dans lequel enregistrer votre Job. Dans la zone Export type, slectionnez le type dexport que vous souhaitez utiliser dans votre application Web Tomcat (WAR pour cet exemple) et cliquez sur Finish. La bote de dialogue [Export Job Scripts] se referme. Copiez le fichier War et collez-le dans le rpertoire de votre Tomcat.

Scnario 3 : Appeler un Job contenant des variables de contexte partir de votre navigateur Web
Ce scnario dcrit la procdure utiliser pour appeler le Job cr dans le scnario 2 partir de votre navigateur Web en modifiant/sans modifier les valeurs des variables de contexte. Saisissez lURL suivante dans votre navigateur Web : http://localhost:8080//export_job/services/export_job3? method=runJob dans laquelle export_job correspond au nom du rpertoire de votre application Web dploy sur le Tomcat et export_job3 correspond au nom de votre Job.

Cliquez sur Enter pour excuter votre Job partir du navigateur.

Guide de Rfrence des Composants Talend Open Studio

1413

Scnario 3 : Appeler un Job contenant des variables de contexte partir de votre navigateur Web

Le Job utilise les valeurs par dfaut des variables de contexte : nb_lines et lastname, et donc gnre trois lignes contenant la date en cours, un prnom et le nom Ford. Vous pouvez modifier les valeurs des variables de contexte directement partir de votre navigateur. Pour appeler le Job partir de votre navigateur et modifier les valeurs des deux variables de contexte, saisissez lURL suivante : http://localhost:8080//export_job/services/export_job3?method=runJob&arg1=--context_param %20lastname=MASSY&arg2=--context_param%20nb_lines=2. %20 correspond un espace blanc lorsquil est utilis dans une URL. Dans le premier argument arg1, dfinissez la valeur MASSY pour la variable de contexte lastname. Ainsi le nom qui apparatra sera MASSY. Dans le deuxime argument arg2, dfinissez la valeur 2 pour la variable de contexte nb_lines pour ne gnrer que deux lignes de donnes. Cliquez sur Enter pour excuter le Job partir du navigateur.

1414

Guide de Rfrence des Composants Talend Open Studio

Scnario 4 : Appeler un Job export en tant que service Web dans un autre Job

Le Job gnre deux lignes avec MASSY comme nom.

Scnario 4 : Appeler un Job export en tant que service Web dans un autre Job
Ce scnario dcrit un Job appelant un autre Job export en tant que service Web en utilisant un composant tWebServiceInput. Ce scnario appellera le Job cr dans le scnario 2. Cliquez-dposez les composants suivants dans le Job Designer : tWebServiceInput et tLogRow. Reliez-les via une connexion de type Row Main.

Dans lespace de travail, slectionnez le composant tWebServiceInput. Cliquez sur la vue Component pour dfinir ses proprits de base dans longlet Basic settings.

Dans la liste Schema, slectionnez Built-In et cliquez sur le bouton [...] cot du champ Edit Schema pour dcrire la structure des donnes que vous souhaitez appeler du Job export. Dans ce scnario, le schma est constitu de trois colonnes, now, firstname, et lastname.

Guide de Rfrence des Composants Talend Open Studio

1415

Scnario 4 : Appeler un Job export en tant que service Web dans un autre Job

Cliquez sur le bouton [+] pour ajouter les trois lignes de paramtres et dfinir vos variables. Cliquez sur OK pour fermer la bote de dialogue. Dans le champ WSDL de longlet Basic settings de la vue Component du tWebServiceInput, saisissez lURL : http://localhost:8080/export_job/services/export_job3?WSDL dans laquelle export_job correspond au nom du rpertoire de votre application Web dans lequel le Job appeler est stock et export_job3 correspond au nom du Job.

Dans le champ Method name, saisissez runJob. Dans la zone Parameters, cliquez sur le bouton [+] pour ajouter deux lignes de paramtres et dfinir vos variables de contexte. Cliquez dans la premire cellule Value pour configurer le paramtre dfinissant le nombre de lignes gnrer : --context_param nb_line=3. Cliquez dans la deuxime cellule Value pour configurer le paramtre dfinissant le nom afficher : -context_param lastname=Ford. Slectionnez le tLogRow et cliquez sur la vue Component pour afficher les proprits du composant. Dans la vue Basic settings du tLogRow, slectionnez loption Table pour afficher les donnes de sortie sous forme de tableau. Pour plus dinformations, consultez la section intitule Proprits du tLogRow . Enregistrez votre Job et appuyez sur F6 pour lexcuter.

1416

Guide de Rfrence des Composants Talend Open Studio

Scnario 4 : Appeler un Job export en tant que service Web dans un autre Job

Le Job gnre trois colonnes contenant la date en cours, des prnoms et des noms, et les affiche dans la console sous forme de tableau.

Guide de Rfrence des Composants Talend Open Studio

1417

tContextDump

tContextDump

Proprits du tContextDump
Famille de composant Fonction Objectif Misc tContextDump fait une copie des valeurs du contexte utilis dans le Job. Le tContextDump peut tre utilis pour transformer les paramtres de contexte dun flux et les rutilisez via un composant tContextLoad. Cette fonction est trs pratique pour rutiliser un contexte que vous naurez dfini quune seule fois, dans plusieurs Jobs via le tContextLoad.. Schema et Edit Schema Le schma du composant tContextDump est en lecture seule et est compos de deux colonnes : Key et Value, qui correspondent au nom et la valeur du paramtre copier. Un schma est une description de lignes, i.e., il dfinit les champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que lorsque vous modifiez le schma, les proprits deviennent automatiquement built-in. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur de Talend Open Studio. Print operations Utilisation Limitation Cochez cette case pour afficher les paramtres de contexte dans la vue Run.

Basic settings

Ce composant cre un flux de donnes partir des valeurs de contexte, ainsi il doit tre connect un composant de sortie. Le tContextDump ne cre pas de variable de contexte non dfinie.

Scnario associ
Aucun scnario nest disponible pour ce composant.

1418

Guide de Rfrence des Composants Talend Open Studio

tContextLoad

tContextLoad

Proprits du tContextLoad
Famille de composant Fonction Objectif Misc Le composant tContextLoad modifie dynamiquement les valeurs du contexte actif. Le tContextLoad permet de charger un contexte partir dun flux entrant. Ce composant effectue aussi deux contrles. Il prvient lorsque les paramtres dfinis dans le flux entrant ne sont pas dfinis dans le contexte. Il avertit galement lorsque la valeur dun contexte nest pas initialise dans le flux entrant. Mais notez que ces avertissements ne bloquent pas le traitement. Basic settings Schema et Edit Schema Le schma du composant tContextLoad doit tre compos de deux colonnes, lune contenant le nom du paramtre et la deuxime contenant la valeur du paramtre charger. Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, les proprits deviennent automatiquement built-in. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. If a variable loaded, but Si une variable est charge mais napparat pas dans le not in the context contexte, choisissez comment doit safficher la notification. Sous forme derreur (Error), de warning (warning), ou dinformation (info). If a variable in the Si une variable apparat dans le contexte mais nest pas context, but not loaded charge, choisissez comment doit safficher la notification. Sous forme derreur (Error), de warning (warning), ou dinformation (info). Print operations Disable errors Disable warnings Disable infos Cochez cette case pour afficher les paramtres de contexte dans la vue Run. Cochez cette case pour ne pas afficher derreur. Cochez cette case pour ne pas afficher de warning. Cochez cette case pour ne pas afficher dinformation.

Guide de Rfrence des Composants Talend Open Studio

1419

Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL

Die on error

Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et les lignes contenant les erreurs seront ignores.

Advanced settings Utilisation

tStat Catcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant. Ce composant sappuie sur le flux de donnes pour charger les valeurs de contexte utiliser. Ainsi, il requiert un composant dentre et ne peut pas tre un composant de dbut. Le tContextLoad ne cre aucune variable qui na pas t dfinie dans le contexte par dfaut.

Limitation

Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL
Ce scnario est compos de deux sous-Jobs. Le premier permet de charger dynamiquement des paramtres de contexte et le deuxime utilise ces paramtres chargs pour afficher le contenu dune base de donnes.

Cliquez et dposez les composants : tFilelist, tFileInputDelimited, tContextLoad pour le premier sous-Job. Et cliquez et dposez les composants tMysqlInput et tLogRow pour le deuxime. Connectez-les comme indiqu sur le schma ci-dessus. Crez autant de fichiers dlimits quil y a de contextes diffrents et conservez-les dans un rpertoire spcifique appel Contexts. Dans ce scnario, test.txt contient les informations de connexion la base de donnes locale de test et prod.txt contient les informations de connexion de la base de donnes distante de production. Chaque fichier est constitu de deux champs contenant le nom du paramtre et sa valeur correspondante, en fonction du contexte.

Dans longlet Basic settings du composant tFileList, slectionnez le rpertoire contexts dans lequel les deux fichiers test et prod seront stocks.

1420

Guide de Rfrence des Composants Talend Open Studio

Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL

Dans longlet Basic settings du composant tFileInputDelimited, dans le champ File Name, appuyez sur Ctrl +Espace pour accder la liste des variables globales. Slectionnez tFileList_1.CURRENT_FILEPATH qui permet de faire une boucle sur le rpertoire contenant les fichiers de contexte. Dfinissez le schma manuellement (Built-in) en cliquant sur le bouton Edit schema. Il contient deux colonnes : Key et Value, correspondant respectivement au paramtre et sa valeur. Acceptez la propagation du schma dfini au composant suivant (tContextLoad). Pour ce scnario, cochez la case Print operations pour afficher les paramtres de contexte utiliss dans la vue Run. Puis double-cliquez sur le composant tMysqlInput pour accder ses proprits dans longet Basic settings. Pour chacune des valeurs stockes dans le fichier de contexte, appuyez sur F5 et dfinissez le paramtre de contexte devant tre dfini par lutilisateur. Par exemple, le champ Host a pour valeur de paramtre context.host, dont le nom de paramtre est host dans le fichier de contexte. Sa valeur actuelle est talend-dbms.

Puis dans le champ Schema Type, renseignez les informations sur le schma. Si le schma est stock dans le noeud Metadata du Repository sous forme de mtadonne, slectionnez-le aprs avoir slectionn loption Repository. Dans le champ Query, saisissez la requte SQL devant tre excute sur la table spcifie. Dans ce Job, effectuez un simple SELECT des colonnes de la table, qui seront ensuite affiches dans longlet Run grce au composant tLogRow. Enfin, appuyez sur F6 pour excuter le Job.

Guide de Rfrence des Composants Talend Open Studio

1421

Scnario : Utiliser un contexte dynamique lors dun insert dans une base de donnes MySQL

Les paramtres de contexte et les valeurs slectionns dans la table sont affichs dans la console Run.

1422

Guide de Rfrence des Composants Talend Open Studio

tFixedFlowInput

tFixedFlowInput

Proprits du tFixedFlowInput
Famille du composant Fonction Objectif Basic settings Misc Le composant tFixedFlowInput gnre autant de lignes et de champs que vous souhaitez alimenter par des valeurs fixes. Le tFixedFlowInput permet de gnrer des donnes fixes partir de variables internes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et il est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide Utilisateur de Talend Open Studio. Mode Slectionnez le mode, parmi les trois proposs, que vous souhaitez utiliser. Use Single Table : Saisissez la donne que vous souhaitez gnrer dans la colonne Value correspondante. Use Inline Table : Ajoutez la ou les ligne(s) que vous souhaitez gnrer. Use Inline Content : Saisissez vos donnes gnrer, spares par les sparateurs pralablement dfinis dans les champs Row et Field Separator. Number of rows Values Saisissez le nombre de lignes de donnes gnrer. Saisissez entre guillemets les valeurs correspondant aux colonnes dfinies dans la bote de dialogue du schma, via le bouton Edit schema. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant peut tre utilis comme composant de dbut ou de milieu, il requiert donc un composant de sortie.

Scnarios associs
Pour des scnarios associs, consultez : la section intitule Scnario 2 : Mettre les donnes de sortie en mmoire tampon du serveur dapplication Web .

Guide de Rfrence des Composants Talend Open Studio

1423

Scnarios associs

la section intitule Scnario : Itrer une table de base de donnes et lister le nom des colonnes de la table .

1424

Guide de Rfrence des Composants Talend Open Studio

tMemorizeRows

tMemorizeRows

Proprits du tMemorizeRows
Famille de composant Fonction Misc Le composant tMemorizeRows mmorise temporairement une collection de donnes entrantes en squence ligne par ligne et instancie cette collection en indexant chaque ligne mmorise partir de 0. Le nombre maximum de lignes mmoriser un moment donn est dfini dans la vue Basic settings. Le tMemorizeRows mmorise une squence de lignes passant dans ce composant et permet au(x) composant(s) suivant(s) deffectuer des oprations sur les lignes mmorises, selon vos besoins. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. - Cliquez sur Edit Schema afin dapporter des modifications au schma. Notez que, si vous modifiez le schma, il devient automatiquement Built-In. - Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide Utilisateur de Talend Open Studio. Row count to memorize Saisissez le nom de lignes dfinir. Columns to memorize Advanced settings Utilisation tStatCatcher Statistics Slectionnez les colonnes mmoriser du schma dentre. Cochez cette case pour collecter les donnes de log au niveau du composant.

Objectif

Ce composant peut tre utilis en tant qutape intermdiaire dans un flux de donnes ou comme dernire tape avant de lancer un sous-job. Note: Vous pouvez utiliser la variable globale NB_LINE_ROWS afin de rcuprr la valeur renseigne dans le champ Row count to memorize du composant tMemorizeRows.

Connections

Liens de sortie (dun composant un autre) : Row : Main. Trigger : Run if, On Component Ok, On Component Error. Liens dentre (dun composant un autre) :

Guide de Rfrence des Composants Talend Open Studio

1425

Scnario : Compter le nombre doccurrences de diffrents ges

Row : Main. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio.

Scnario : Compter le nombre doccurrences de diffrents ges


Ce scnario a pour objectif de compter le nombre dges diffrents se trouvant dans un groupe de 12 clients. Dans ce scnario, les donnes client sont gnres de manire alatoire.

Ce Job utilise les cinq composants suivants : tRowGenerator : ce composant gnre 12 lignes de donnes client contenant les IDs, noms et ges des 12 clients. tSortRow : ce composant trie les 12 lignes selon les donnes de lge. tMemorizeRows : il mmorise temporairement un nombre spcifique de lignes de donnes entrantes un moment donn et indexe les lignes de donnes mmorises. tJavaFlex : ce composant compare la valeur des ges dans les donnes mmorises par le composant prcdent, compte le nombre doccurrences des diffrents ges et affiche ces ges dans la vue Run. tJava : il affiche le nombre doccurrences des diffrents ges. Pour reproduire le scnario, procdez comme suit : Dposez les composants suivants de la Palette dans lespace de modlisation graphique : tRowGenerator, tSortRow, tMemorizeRows, tJavaFlex et tJava. Cliquez-droit sur le tRowGenerator Dans le menu contextuel, slectionnez le lien Row > Main. Cliquez sur le tSortRow afin de lier ces deux composants. Rptez lopration pour connecter le tSortRow, le tMemorizeRows et le tJavaFlex laide dun lien Row > Main. Cliquez-droit sur le tRowGenerator Dans le menu contextuel, slectionnez le lien Trigger > OnSubjobOk. Cliquez sur le tJava pour relier les composants. Double-cliquez sur le composant tRowGenerator afin douvrir son diteur.

1426

Guide de Rfrence des Composants Talend Open Studio

Scnario : Compter le nombre doccurrences de diffrents ges

Dans cet diteur, cliquez trois fois sur le bouton [+] pour ajouter trois colonnes, que vous nommerez : id, name, age. Dans la colonne Type, slectionnez Integer pour les colonnes id et age. Dans la colonne Length, saisissez 50 pour la colonne name. Dans la colonne Functions, slectionnez random pour id et age, puis slectionnez getFirstName pour name. Dans le champ Number of Rows for RowGenerator, saisissez 12. Dans la colonne Column, cliquez sur age afin douvrir sa vue Function parameters dans la partie infrieure de lditeur.

Dans la colonne Value de la vue Function parameters, saisissez lge minimum et lge maximum gnrer pour les 12 clients. Dans cet exemple, saisissez respectivement 10 et 25. Cliquez sur OK afin de sauvegarder la configuration. Dans la bote de dialogue qui souvre, cliquez sur Yes (Oui) afin de propager les modifications aux autres composants.

Guide de Rfrence des Composants Talend Open Studio

1427

Scnario : Compter le nombre doccurrences de diffrents ges

Double-cliquez sur le tSortRow afin douvrir sa vue Component.

Dans le tableau Criteria, cliquez sur le bouton [+] afin dajouter une ligne. Dans la colonne Schema column, slectionnez la colonne de donnes sur laquelle vous souhaitez baser le tri. Dans cet exemple, slectionnez age, puisque les ges seront compars et compts. Dans la colonne Sort num or alpha, slectionnez le type de tri. Dans cet exemple, comme age est un entier (integer), slectionnez num, pour numrique. Dans la colonne Order asc or desc, slectionnez desc comme ordre de tri. Double-cliquez sur le composant tMemorizeRows afin douvrir sa vue Component.

Dans le champ Row count to memorize, saisissez le nombre maximum de lignes mmoriser un moment donn. Puisque vous devez comparer les ges de deux clients chaque fois, saisissez 2. Ce composant mmorise deux lignes au maximum un moment donn et indexe toujours la nouvelle ligne entrante comme 0 et la ligne prcdente comme 1. Dans la colonne Memorize du tableau Columns to memorize, cochez la (les) case(s) de la (des) colonne(s) mmoriser. Dans cet exemple, cochez la case correspondant la colonne age. Double-cliquez sur le tJavaFlex afin douvrir sa vue Component.

1428

Guide de Rfrence des Composants Talend Open Studio

Scnario : Compter le nombre doccurrences de diffrents ges

Dans la zone Start code, saisissez le code Java qui sera appel durant la phase dinitialisation. Dans cet exemple, saisissez int count=0; afin de dclarer une variable count et de lui assigner la valeur 0. Dans la zone Main code, saisissez le code Java appliquer chaque ligne du flux de donnes. Dans ce scnario, saisissez : if(age_tMemorizeRows_1[1]!=age_tMemorizeRows_1[0]) { count++; } System.out.println(age_tMemorizeRows_1[0]); Ce code compare les deux ges mmoriss chaque fois par le tMemorizeRows et compte un changement chaque fois que des ges diffrents sont trouvs. Ce code affiche galement les ges indexs comme 0 par le tMemorizeRows. Dans la zone End code, saisissez le code qui sera appel durant la phase de fermeture. Dans cet exemple, saisissez globalMap.put("count", count); afin dcrire le rsultat du compte. Double-cliquez sur le tJava afin douvrir sa vue Component.

Dans la zone Code, saisissez le code System.out.println("Different ages : "+globalMap.get("count"));

Guide de Rfrence des Composants Talend Open Studio

1429

Scnario : Compter le nombre doccurrences de diffrents ges

afin de rcuprer le rsultat du compte. Appuyez sur F6 afin dexcuter le Job. Le rsultat saffiche dans la console de la vue Run.

Dans la console, vous pouvez constater quil y a dix ges diffrents dans le groupe des 12 clients.

1430

Guide de Rfrence des Composants Talend Open Studio

tMsgBox

tMsgBox

Proprits du tMsgBox
Famille de composant Fonction Objectif Basic settings Misc Le composant tMsgBox ouvre une bote de dialogue contenant un bouton OK, ncessitant une action de la part de lutilisateur. Ce composant est une pause graphique dans le cours du traitement. Title Buttons Le texte saisi saffiche dans la barre de titre de la bote de dialogue. Liste des boutons que vous souhaitez inclure dans la bote de dialogue. Les combinaisons de bouton sont restreintes et ne peuvent tre changes. Le bouton Question fait apparatre la case Masquer la rponse, qui une fois coche vous permet de masquer la rponse que vous saisissez dans la fentre pop-up qui s'affiche quand vous excutez votre Job. Icon Message Utilisation Icne de la barre de titre de la bote de dialogue. Texte libre afficher dans la bote de dialogue. Le texte peut tre dynamique (ex : reprendre un nom de fichier).

Ce composant peut tre utilis comme tape intermdiaire du traitement ou comme composant de dbut ou de fin de Job. Il peut tre connect laide dun lien Row ou Iterate.

Limitation

Scnario : Test de type Hello world!


Le scnario suivant reprsente un Job un seul composant utilis pour afficher lheure et la date la place du message Hello World!. Cliquez et dposez un composant tMsgBox dans lespace de modlisation. Paramtrez les proprits daffichage du message :

Guide de Rfrence des Composants Talend Open Studio

1431

Scnario : Test de type Hello world!

Title est le titre de la bote de message, vous pouvez utiliser nimporte quelle variable. Dans le champ Message, saisissez le texte "Current date is: " entre guillemets doubles concatn laide dun +, puis appuyez sur Ctrl+Espace afin dafficher la liste dauto-compltion, et slectionnez la routine systme TalendDate.getCurrentDate. Entourez-la de parenthses. Cliquez sur longlet Run puis excutez le Job. Le message affiche le texte dfini prcdemment et requiert une action de lutilisateur pour disparatre et passer au composant suivant ou terminer le Job.

Aprs avoir cliqu sur le bouton OK, le log de la vue Run est mis jour. Voir galement le Guide utilisateur de Talend Open Studio.

1432

Guide de Rfrence des Composants Talend Open Studio

tRowGenerator

tRowGenerator

Proprits du tRowGenerator
Famille de composant Fonction Misc Le composant tRowGenerator gnre autant de lignes et de champs que vous souhaitez alimenter par des valeurs prises de faon alatoire dans une liste dfinie. Ce composant peut tre utilis des fins de test, pour crer un flux dentre dans le cadre de jeux de tests. Schema type et Un schma est une description de lignes, i.e., il dfinit le Edit Schema nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Basic settings RowGenerator editor Lditeur vous permet de dfinir prcisment les colonnes et la nature des donnes gnrer. Vous pouvez prdfinir des routines ou saisir vous-mme la fonction utiliser pour gnrer les donnes souhaites.

Objectif

Advanced settings Utilisation Limitation

tStatCatcher Sta- Cochez cette case pour collecter les donnes de log au niveau tistics du composant. La simplicit dutilisation de lditeur du tRowGenerator vous permet de gnrer des donnes de faon alatoire sans connaissance du langage Java. n/a

Lditeur du tRowGenerator souvre dans une fentre spare constitue de deux parties : dans la partie suprieure de la fentre, une vue de dfinition de Schema, dans la partie infrieure, une vue Function de dfinition et daperu des fonctions.

Dfinition du schma
Pour commencer, vous devez dfinir la structure des donnes gnrer. Ajoutez autant de colonnes que ncessaire laide du bouton plus [+]. Dans la zone Columns, saisissez les noms des colonnes crer et cochez la case Key si ncessaire. Assurez-vous davoir correctement dfini la nature des donnes contenues dans la colonne en slectionnant le type dans la colonne Type. En fonction du type slectionn, la liste des fonctions proposes dans la colonne Function diffre. Cette information est obligatoire.

Guide de Rfrence des Composants Talend Open Studio

1433

Scnario : Gnration alatoire de fichiers de test

Dautres informations, bien que facultatives, peuvent tre utiles, telles que les colonnes Length, Precision ou Comment. Mais vous avez la possibilit de cacher les colonnes que vous nutilisez pas, en cliquant sur le bouton Columns dans la barre doutils et en dcochant les colonnes que vous souhaitez cacher. Dans la zone Function, slectionnez la routine/fonction prdfinie si lune des propositions correspond vos besoins. Vous pouvez galement ajouter cette liste toute routine que vous avez dveloppe et stocke dans la partie Routine du Repository. Vous avez enfin la possiblit de saisir directement la fonction que vous souhaitez utiliser dans la vue Function. Voir galement : la section intitule Dfinition dune fonction . Cliquez sur Refresh pour visualiser un aperu des donnes gnres. Saisissez le nombre de lignes gnrer. Plus le nombre de lignes est lev, plus la dure dexcution sera longue pour cette opration de gnration.

Dfinition dune fonction


Vous avez slectionn les trois points [...] dans la colonne Function de lditeur du Schma, car vous souhaitez personnaliser la fonction de gnration. Slectionnez longlet Function parameters. La zone Parameter affiche Customized parameter comme nom du paramtre (en lecture seule).

Dans la zone Value, saisissez la fonction Java que vous souhaitez utiliser pour gnrer des donnes. Cliquez sur longlet Preview et cliquez sur le bouton Preview pour visualiser un chantillon des donnes qui seront gnres.

Scnario : Gnration alatoire de fichiers de test


Le scnario suivant dcrit un Job de deux composants, gnrant 50 lignes composes de la manire suivante : un ID alatoire compris entre 1 et 3, un nom et un prnom pris de manire alatoire dans une liste de chanes de caractres, et le champ Date dfinie dans une priode donne.

1434

Guide de Rfrence des Composants Talend Open Studio

Scnario : Gnration alatoire de fichiers de test

Cliquez et dposez un composant tRowGenerator et un composant tLogRow dans lespace de modlisation. Cliquez-droit sur le composant tRowGenerator et slectionnez le lien Row > Main. Faites glisser ce lien jusquau composant tLogRow. Double-cliquez sur le composant tRowGenerator pour ouvrir lditeur. Dfinissez les champs gnrer.

La colonne ID (random_ID) est de type entier (integer), les noms et prnoms sont de type chane de caractres (String) et la Date est de type Date. Dans la colonne Function, slectionnez la fonction adapte dans la liste ou les trois points [...] pour la fonction personnalise. Dans longlet Function parameters, dfinissez les valeurs prendre de faon alatoire.

Les colonnes First_Name et Last_Name sont gnrer laide dune fonction getAsciiRandomString prdfinie dans les routines systme. Par dfaut, la longueur dfinie est de 6 caractres, mais vous pouvez la changer. La colonne Date appelle galement une fonction prdfinie getRandomDate. Vous pouvez diter les valeurs de paramtre dans longlet Function parameters. Dans le champ Number of Rows, paramtrez le nombre de lignes 50. Cliquez sur OK pour valider les paramtres. Double-cliquez sur le composant tLogRow pour visualiser les paramtres dans longlet Basic settings. Retenez les paramtres par dfaut. Appuyez sur F6 pour excuter le Job.

Guide de Rfrence des Composants Talend Open Studio

1435

Scnario : Gnration alatoire de fichiers de test

Les 50 lignes sont gnres selon les paramtres dfinis dans lditeur du composant tRowGenerator et sont affiches en sortie standard de la vue Run.

1436

Guide de Rfrence des Composants Talend Open Studio

Composants Orchestration
Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille Orchestration de la Palette de Talend Open Studio. La famille Orchestration regroupe les composants vous permettant de squencer et dorchestrer les tches ou les traitements de vos Jobs et sous-Jobs.

Guide de Rfrence des Composants Talend Open Studio

tFileList

tFileList

Le tFileList appartient deux familles : File et Orchestration. Pour plus dinformations concernant le composant tFileList, consultez la section intitule tFileList .

1438

Guide de Rfrence des Composants Talend Open Studio

tFlowToIterate

tFlowToIterate

Proprits du tFlowToIterate
Famille du composant Fonction Objectif Basic settings Orchestration Le composant tFlowToIterate transforme un flux de donnes en une liste. Le tFlowToIterate permet de transformer un flux traitable en donnes non traitables. Use the default (key, va- Lorsque cette case est coche, le systme utilise la valeur lue) in global variables par dfaut de la variable globale utilise dans le Job. Customize key : Entrez le nom de la nouvelle variable globale. Appuyez sur Ctrl+Espace pour accder lensemble des variables disponibles, quelles soient globales ou dfinies par lutilisateur. value : Cliquez dans la cellule pour accder la liste des colonnes rattaches la variable globale dfinie. Utilisation Global Variables Le tFlowToIterate nest pas un composant de dbut, et il requiert un composant de sortie. Number of Lines : indique le nombre de lignes traites. Disponible comme variable After. Retourne un entier. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Iterate. Trigger : Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main. Pour plus dinformations concernant les liens, consultez le Guide utilisateur Talend Open Studio.

Scnario : Transformer un flux de donnes en liste


Le scnario suivant dcrit un Job permettant de lire une liste de fichiers partir dun fichier dentre donn. Il effectue galement une itration sur chacun des fichiers, slectionne les donnes dentre et affiche le rsultat en sortie dans la console de log Run.

Guide de Rfrence des Composants Talend Open Studio

1439

Scnario : Transformer un flux de donnes en liste

A partir de la Palette, cliquez-dposez les composants suivants dans lespace de modlisation : deux tFileInputDelimited, un tFlowToIterate et un tLogRow. Cliquez-droit sur chacun des composants pour les relier entre eux. Connectez le premier tFileInputDelimited au tFlowToIterate laide dun lien de type Row Main, puis le tFlowToIterate au deuxime tFileInputDelimited laide dun lien de type Iterate, enfin le second tFileInputDelimited au tLogRow laide dun lien de type Row Main.

Dans lespace graphique, slectionnez le premier tFileInputDelimited. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du composant tFileInputDelimited. Dans la vue Basic settings, cliquez sur le bouton [...] situ ct du champ File Name pour dterminer le chemin daccs au fichier dentre. Le champ File Name est obligatoire.

Le fichier dentre utilis dans ce scnario sappelle Customers. Il sagit dun fichier texte contenant trois autres fichiers texte simples : Name, E-mail et Address. Le fichier Name est constitu dune colonne contenant le nom des clients et le fichier E-mail dune colonne contenant ladresse email de ces clients. Le troisime fichier texte, Address, est compos dune colonne comprenant ladresse postale des clients. Renseignez les autres champs en fonction de votre fichier. Pour plus dinformations sur le tFileInputDelimited, consultez la section intitule Proprits du tMDMInput . Dans ce scnario, len-tte, le pied de page et le nombre limite de lignes traiter ne sont pas dfinis. Donc, laissez les champs Header (en-tte) et Footer (pied de page) et Limit par dfaut. Cliquez sur le bouton Edit schema pour dcrire la structure des donnes du fichier dentre. Dans ce scnario, le schma comporte une seule colonne appele FileName.

1440

Guide de Rfrence des Composants Talend Open Studio

Scnario : Transformer un flux de donnes en liste

Dans lespace graphique, slectionnez le tFlowToIterate. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du composant tFlowToIterate.

Cochez la case Use the default (key, value) in global variables si besoin. Cette option permet dutiliser la valeur par dfaut de la variable globale. Cliquez sur le bouton [+] pour ajouter une ligne de paramtres puis dfinissez vos variables. Cliquez dans la cellule de la colonne key pour modifier le nom de la variable selon vos dsirs. Vous pouvez appuyer sur Ctrl+Espace partir de la cellule de la colonne key pour accder la liste des variables globales et des variables utilisateur. Dans lespace graphique, slectionnez le second composant tFileInputDelimited. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) de ce second tFileInputDelimited.

Dans le champ File Name, renseignez le nom du fichier en utilisant la variable approprie. Vous devez saisir +globalMap.get(file). Remplissez les autres champs selon vos besoins. Pour plus dinformations, consultez la section intitule Proprits du tMDMInput .

Guide de Rfrence des Composants Talend Open Studio

1441

Scnario : Transformer un flux de donnes en liste

Dans lespace graphique, slectionnez le dernier composant, le tLogRow. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tLogRow.

Dfinissez les paramtres selon vos besoins. Pour plus dinformations, consultez la section intitule Proprits du tLogRow . Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

La console affiche, pour chaque ligne, le nom du client, son e-mail et son adresse, prcds du nom de la colonne du schma.

1442

Guide de Rfrence des Composants Talend Open Studio

tForeach

tForeach

Proprits du tForeach
Famille de composant Fonction Objectif Basic settings Orchestration Le composant tForeach cre une boucle sur une liste pour un lien Iterate. Le tForeach vous permet de crer une boucle sur une liste pour un lien Iterate. Values Utilisez le bouton [+] pour ajouter des lignes au tableau Values. Cliquez ensuite sur les champs afin de saisir, entre guillemets, les valeurs de la liste sur laquelle effectuer une boucle.

Advanced settings Utilisation Limitation

tStatCatcher Sta- Cochez cette case pour collecter les donnes de log au niveau tistics du composant. Le tForeach est un composant dentre. Un lien Iterate est requis pour relier ce composant un autre. n/a

Scnario : Faire une boucle sur une liste et rcuprer les valeurs
Ce scnario dcrit un Job deux composants dans lequel une liste est cre et sur laquelle est effectue une boucle, via un composant tForeach. Les valeurs sont rcupres par un composant tJava. Dposez de la Palette dans lespace de modlisation graphique les composants tForeach et tJava.

Reliez le tForeach au tJava laide dun lien Row > Iterate. Double-cliquez sur le tForeach afin douvrir sa vue Basic settings.

Guide de Rfrence des Composants Talend Open Studio

1443

Scnario : Faire une boucle sur une liste et rcuprer les valeurs

Cliquez sur le bouton

pour ajouter autant de lignes que ncessaire dans le tableau Values.

Cliquez sur les champs Value afin de saisir les valeurs de la liste, entre guillemets doubles. Double-cliquez sur le tJava afin douvrir sa vue Basic settings.

Saisissez le code Java suivant dans la System.out.println(globalMap.get("tForeach_1_CURRENT_VALUE")+"_out"); Sauvegardez le Job et appuyez sur F6 pour lexcuter.

zone

Code

La console affiche la liste des valeurs rcupres du tForeach, chaque valeur ayant le suffixe _out.

1444

Guide de Rfrence des Composants Talend Open Studio

Scnario : Faire une boucle sur une liste et rcuprer les valeurs

Guide de Rfrence des Composants Talend Open Studio

1445

tInfiniteLoop

tInfiniteLoop

Proprits du tInfiniteLoop
Famille de composant Fonction Objectif Basic settings Orchestration Le composant tInfiniteLoop fait une boucle linfini sur lexcution dune tche. Le tInfiniteLoop permet dexcuter automatiquement une tche ou un Job dans une boucle, linfini. Wait at each ite- Saisissez le temps, en millisecondes, dattente entre chaque itration (in millise- ration. condes) tStatCatcher Sta- Cochez cette case pour collecter les donnes de log au niveau tistics du composant. Le composant tInifniteLoop est un composant de dbut et requiert une connexion de type Iterate au composant suivant. Current iteration : indique le nombre ditrations. Disponible comme variable Flow. Retourne un entier. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a

Advanced settings Utilisation Global Variables

Scnario associ
Pour un exemple dutilisation proche, consultez la section intitule Scnario : Excuter un Job partir dune boucle du composant tLoop.

1446

Guide de Rfrence des Composants Talend Open Studio

tIterateToFlow

tIterateToFlow

Proprits du tIterateToFlow
Famille de composant Fonction Objectif Basic settings Orchestration Le composant tIterateToFlow transforme une liste en flux de donnes pouvant tre trait. Ce composant permet de transformer des donnes non traitables en flux traitable. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Lors de lutilisation du tIterateToFlow, le schma doit tre dfini. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Mapping Column :Saisissez le nom des colonnes crer. Value : Appuyez sur Ctrl+Espace pour accder toutes les variables disponibles soit globales soit celles que vous avez dfinies. Advanced settings Utilisation Connections tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant nest pas un composant de dbut (fond vert) et requiert un composant de sortie. Liens de sortie (dun composant un autre) : Row : Main. Trigger : Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Iterate. Pour plus dinformations concernant les liens, consultez leGuide Utilisateur Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

1447

Scnario : Transformer une liste de fichiers en flux de donnes

Scnario : Transformer une liste de fichiers en flux de donnes


Le scnario suivant dcrit un Job permettant de faire une boucle sur une liste de fichiers, de rcuprer leur nom, ainsi que la date en cours, pour ensuite transformer ces donnes en un flux qui sera affich dans la console.

Cliquez et dposez les composants suivants : tFileList, tIterateToFlow et tLogRow. Connectez le tFileList au tIterateToFlow laide dun lien Iterate et connectez le Job au composant tLogRow laide dun lien Row main. Dans la vue Component du composant tFileList, donnez le chemin daccs au rpertoire contenant la liste de fichiers.

Dans cet exemple, les fichiers sont trois fichiers .txt simples stocks dans le rpertoire Countries. Dans la liste Case sensitive, slectionnez No (Non) pour ne pas tenir compte de la casse. Slectionnez le composant tIterateToFlow et cliquez sur Edit Schema pour modifier le nouveau schma.

Ajoutez deux nouvelles colonnes : Filename de type String et Date de type date. Assurez-vous davoir paramtr le bon modle en Java. Cliquez sur OK pour valider. Une bote de dialogue souvre et vous demande si vous souhaitez propager les changements. Cliquez sur Yes (Oui). Notez que ce nouveau schma apparat dans le tableau Mapping.

1448

Guide de Rfrence des Composants Talend Open Studio

Scnario : Transformer une liste de fichiers en flux de donnes

Dans chaque cellule de la colonne Value, appuyez sur Ctrl+Espace pour accder la liste des variables globales et celles que vous avez dfinies. Pour la colonne Filename, utilisez la variable globale : tFileList_1CURRENT_FILEPATH. Elle reprend le chemin daccs courant pour recueillir le nom de chaque fichier, le Job fait une boucle sur ce rpertoire. Pour le colonne Date, utilisez la routine Talend : TalendDate.getCurrentDate(). Puis dans la vue Component du composant tLogRow, cochez la case Print values in cells of a table. Enregistrez votre Job et excutez-le, en appuyant sur F6.

Le chemin daccs apparat dans la colonne Filename et la date en cours apparat dans la colonne Date.

Guide de Rfrence des Composants Talend Open Studio

1449

tLoop

tLoop

Proprits du tLoop
Famille de composant Fonction Objectif Basic settings Orchestration Le composant tLoop fait une boucle sur lexcution dune tche. Le tLoop permet dexcuter automatiquement une tche ou un Job dans une boucle. Loop Type Slectionnez le type de boucle effectuer : For ou While. For : La tche ou le Job est excut(e) pour le nombre de boucle dfini. While : La tche ou le Job est excut(e) jusqu ce que la condition soit rencontre. For From Saisissez le numro de la premire instance sur laquelle la boucle doit commencer. Si vous slectionnez linstance numro 2 comme instance de dpart et que vous prenez un cart de 2, cela signifie que la boucle se fera sur tous les nombres pairs. Saisissez la dernire instance sur laquelle la boucle doit passer. Saisissez lcart entre deux instances avec lequel la boucle doit seffectuer. Un cart de 2 signifie que la boucle passe toutes les deux instances. Saisissez une expression dclenchant la boucle. Saisissez la condition devant tre rencontre pour que la boucle sarrte. Saisissez lexpression dcrivant lopration effectuer chaque boucle.

To Step

While

Declaration Condition Iteration

Advanced settings Utilisation Global Variables

tStatCatcher Sta- Cochez cette case pour collecter les donnes de log au niveau tistics du composant. Le composant tLoop est un composant de dbut et requiert une connexion de type Iterate au composant suivant. Current value : indique la valeur actuelle. Disponible comme variable Flow. Retourne un entier. Current iteration : indique le nombre ditrations. Disponible comme variable Flow. Retourne un entier. La variable CURRENT_VALUE n'est disponible qu'avec un composant tLoop de type For. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

1450

Guide de Rfrence des Composants Talend Open Studio

Scnario : Excuter un Job partir dune boucle

Connections

Liens de sortie (dun composant un autre) : Row : Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio.

Limitation

n/a

Scnario : Excuter un Job partir dune boucle


Ce scnario dcrit un Job constitu dun Job parent et dun Job enfant. Le Job parent excute une boucle qui permet dexcuter un Job enfant n nombre de fois, avec une pause entre chaque excution.

Dans le Job parent, cliquez et dposez les composants tLoop, tRunJob et tSleep dans lespace de modlisation. Connectez le composant tLoop au tRunJob laide dune connexion de type Iterate. Puis connectez le tRunJob au tSleep laide dune connexion de type Row. Dans le Job enfant, cliquez et dposez les composants suivants : tPOP, tFileInputMail et tLogRow. Dans longlet Basic settings du composant tLoop, saisissez le numro de linstance sur lequel commencer (1), le numro de linstance sur lequel finir (5) et lcart utiliser (1). Dans longlet Basic settings du composant tRunJob, slectionnez le Job enfant dans la liste des Jobs proposs, pour cet exemple : popinputmail.

Guide de Rfrence des Composants Talend Open Studio

1451

Scnario : Excuter un Job partir dune boucle

Slectionnez le contexte, si ncessaire. Pour cet exemple, le contexte est celui par dfaut (default) ne contenant aucune variable. Dans longlet Basic settings du composant tSleep, saisissez la dure de la pause en secondes dans le champ Pause. Pour cet exemple, la pause est de 3 seconds. Dans longlet Basic settings du Job enfant, dfinissez les paramtres de connexion au serveur pop. Dans longlet Basic settings du composant tFileInputMail, slectionnez une variable globale dans le champ File Name, pour collecter le fichier courant dans le rpertoire dfini dans le composant tPOP. Appuyez sur Ctrl+Espace pour accder la liste des variables. Pour cet exemple, la variable utiliser est : ((String)globalMap.get("tPOP_1_CURRENT_FILEPATH")) Dfinissez le Schema pour quil inclue llment du mail traiter. Les champs du schma sont les suivants : author, topic, delivery date et number of lines. Dans la colonne Mail part de la table Mail Parts, saisissez le champ de le-mail correspondant chaque colonne dfinie dans le schma. Par exemple : author provient du champ From du fichier e-mail. Puis connectez les composants tFileInputMail et tLogRow. Appuyez sur F6 pour excuter le Job, et vrifiez les rsultats de lexcution dans la vue Run.

1452

Guide de Rfrence des Composants Talend Open Studio

tPostjob

tPostjob

Proprits du tPostjob
Famille du composant Fonction Objectif Utilisation Connections Orchestration Le composant tPostjob dmarre lexcution dun post-job. Le tPostjob dclenche une action requise aprs lexcution dun Job. Le tPostjob est un composant de dbut. Il ne peut tre reli au composant suivant quavec une connexion de type Iterate. Liens de sortie (dun composant un autre) : Trigger : OnComponentOk. Liens dentre (dun composant un autre) : Trigger : Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a

Pour plus dinformations sur le composant tPostjob, consultez le Guide Utilisateur de Talend Open Studio.

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

1453

tPrejob

tPrejob

Proprits du tPrejob
Famille du composant Fonction Objectif Utilisation Connections Orchestration Le composant tPrejob dmarre lexcution dun pr-job. Le tPrejob dclenche une action requise pour lexcution dun Job. Le tPrejob est un composant de dbut. Il ne peut tre reli au composant suivant quavec une connexion de type Iterate. Liens de sortie (dun composant un autre) : Trigger : OnComponentOk. Liens dentre (dun composant un autre) : Trigger : Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a

Pour plus dinformations sur le composant tPrejob, consultez leGuide Utilisateur de Talend Open Studio.

Scnario associ
Aucun scnario nest disponible pour ce composant.

1454

Guide de Rfrence des Composants Talend Open Studio

tReplicate

tReplicate

Proprits du tReplicate
Famille de composant Fonction Objectif Basic settings Orchestration Le composant tReplicate duplique le schma entrant en deux flux identiques. Ce composant permet deffectuer diffrentes oprations sur le mme schma. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository: Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement leGuide utilisateur de Talend Open Studio. Utilisation Connections Ce composant nest pas un composant de dbut (fond vert) puisquil requiert un composant dentre et un composant de sortie. Liens de sortie (dun composant un autre) : Row : Main Trigger : Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row :Main, Reject. Pour plus dinformations concernant les liens, consultez leGuide Utilisateur Talend Open Studio.

Scnario associ
Pour un exemple dutilisation du tReplicate, consultez la section intitule tReplaceList

Guide de Rfrence des Composants Talend Open Studio

1455

tRunJob

tRunJob

Le tRunJob appartient deux familles : Orchestration et System. Pour plus dinformations concernant le composant tRunJob, consultez la section intitule tRunJob .

1456

Guide de Rfrence des Composants Talend Open Studio

tUnite

tUnite

Proprits du tUnite
Famille de composant Fonction Objectif Basic settings Orchestration Le composant tUnite fusionne des donnes de diverses sources, bases sur un mme schma. Ce composant centralise des donnes provenant de sources diverses et htrognes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Advanced settings Utilisation Global Variables tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant nest pas un composant de dbut; il requiert un ou plusieurs composants en entre et un composant de sortie. Number of lines : indique le nombre de lignes traites. Disponible comme variable After. Retourne un entier. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Connections

Liens de sortie (dun composant un autre) : Row : Main. Trigger : Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main, Reject. Pour plus dinformations concernant les liens, consultez leGuide Utilisateur Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

1457

Scnario : Itration sur des fichiers et fusion de contenu

Scnario : Itration sur des fichiers et fusion de contenu


Le Job suivant effectue une itration sur une liste de fichiers puis fusionne leur contenu et affiche le contenu final des deux colonnes dans la console.

Cliquez et dposez les composants suivants dans lespace de modlisation : tFileList, tFileInputDelimited, tUnite et tLogRow. Connectez le composant tFileList au tFileInputDelimited laide dun lien Iterate et connectez les autres composants laide de liens Row main. Dans longlet Basic settings du composant tFileList, slectionnez le rpertoire dans lequel les fichiers fusionner sont stocks.

Dans la liste Case Sensitive, slectionnez Yes (Oui) si vous souhaitez tenir compte de la casse, ou No (Non) si vous ne vous voulez pas la prendre en compte. Pour cet exemple, slectionnez Yes. Les fichiers sont trs basiques et contiennent une liste de pays et leur score respectif.

1458

Guide de Rfrence des Composants Talend Open Studio

Scnario : Itration sur des fichiers et fusion de contenu

Slectionnez le composant tFileInputDelimited et affichez son onglet Basic settings. Dans cet exemple, les paramtres de connexion des fichiers dentre ne sont pas stocks dans les mtadonnes du Repository. Ainsi, slectionnez loption Built-In dans le champ Property type et paramtrez les proprits manuellement.

Pour renseigner le champ File Name, appuyez sur Ctrl+Espace pour accder la liste des variables. Pour traiter tous les fichiers du rpertoire dfini dans le composant tFileList, slectionnez tFileList.CURRENT_FILEPATH dans la liste des variables globales. Conservez les paramtres par dfaut des champs Row et Field separators, ainsi que des autres champs. Cliquez sur le bouton Edit Schema et dfinissez manuellement le schma deux colonnes pour quil corresponde au contenu des fichiers dentre.

Pour cet exemple, les deux colonnes sont Country et Points. Elles peuvent toutes les deux prendre une valeur nulle, ainsi cochez les cases de la colonne Nullable. La colonne Country sera de type String, et la colonne Points sera de type Integer. Cliquez sur OK pour valider les paramtres, puis acceptez la propagation du schma dans le reste du Job. Puis slectionnez le composant tUnite et affichez la vue Component. Notez que le schma de sortie reflte exactement celui dentre et quil est en lecture seule.

Guide de Rfrence des Composants Talend Open Studio

1459

Scnario : Itration sur des fichiers et fusion de contenu

Dans la vue Component du composant tLogRow, cochez la case Print values in cells of the table pour afficher correctement les valeurs de sortie. Enregistrez le Job et excutez-le.

La console affiche les donnes des diffrents fichiers, fusionnes dans une seule table.

1460

Guide de Rfrence des Composants Talend Open Studio

tSleep

tSleep

Proprits du tSleep
Famille de composant Fonction Objectif Orchestration Le composant tSleep effectue une pause lors de lexcution dun Job. Ce composant permet didentifier les goulots dtranglement ventuels laide dune pause lors de lexcution du Job des fins de test ou de monitoring. En production, il peut tre utilis pour tout type de pause dans le traitement dun Job, pour alimenter un flux entrant par exemple. Pause (in second) Temps en seconde pendant lequel le Job est suspendu. Le composant tSleep est gnralement utilis comme composant intermdiaire mettant un Job en pause, avant de le reprendre. Liens de sortie (dun composant un autre) : Row : Main, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a

Basic settings Utilisation Connections

Scnario associ
Pour un exemple dutilisation du tSleep, consultez la section intitule Scnario : Excuter un Job partir dune boucle .

Guide de Rfrence des Composants Talend Open Studio

1461

tWaitForFile

tWaitForFile

Proprits du tWaitForFile
Famille de composant Fonction Orchestration Le composant tWaitForFile fait une boucle sur un rpertoire donn la recherche dajout ou de suppression de fichier puis dclenche un sous-Job lorsque la condition est rencontre. Ce composant permet de dclencher un Job en fonction dune condition lie la prsence ou au retrait dun fichier. Time (in seconds) bet- Paramtrez lintervalle de temps entre chaque vrificaween iterations tion du fichier (en secondes). Max. number of itera- Nombre de vrifications effectuer avant que le Job ne tions (infinite loop if sarrte. empty) Directory to scan File mask Include subdirectories Case sensitive Include present file Trigger action when Nom du rpertoire vrifier. Masque du fichier recherch. Cochez cette case pour inclure les sous-dossiers. Cochez cette case pour tenir compte de la casse. Cochez cette case pour inclure le fichier courant. Slectionnez la condition remplir pour effectuer laction : A file is created : un fichier est cr. A file is deleted : un fichier est supprim. A file is updated : un fichier est mis jour A file is created or updated or deleted : un fichier est cr, supprim ou mis jour. Then Slectionnez laction effectuer : soit stopper litration lorsque la condition est rencontre (exit loop) soit continuer la boucle jusqu ce que le nombre maximum ditrations soit atteint (continue loop).

Objectif Basic settings

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job designs. Voir galement leGuide utilisateur de Talend Open Studio.

1462

Guide de Rfrence des Composants Talend Open Studio

Proprits du tWaitForFile

Advanced settings

Wait for file to be relea- Cochez cette case afin que le sous-job ne se dclenche sed quaprs la fin de linsertion/de la mise jour/de la suppression. Si lopration nest pas termine, le sous-job ne se dclenchera pas. Ce composant est un composant de dbut (ou de dclenchement) pour le sous-Job excut en fonction de la condition tablie. Ainsi, ce composant doit tre connect un sous-job via un lien Iterate. Current iteration : indique le nombre ditrations. Disponible comme variable Flow. Retourne un entier. Present File : indique le nom du fichier courant dans litration ayant activ le dclenchement. Disponible comme variable Flow. Retourne une chane de caractres. Deleted File : indique le nom et le chemin daccs du fichier supprim qui a activ le dclenchement. Disponible comme variable Flow. Retourne une chane de caractres. Created File Name : indique le nom et le chemin daccs du fichier nouvellement cr ayant activ le dclenchement. Disponible comme variable Flow. Retourne une chane de caractres. Updated File : indique le nom et le chemin daccs du fichier mis jour, activant ainsi le dclenchement. Disponible comme variable Flow. Retourne une chane de caractres. File Name : indique le nom dun fichier cr, supprim ou mis jour, activant ainsi le dclenchement. Disponible comme variable Flow. Retourne une chane de caractres. Not Updated File Name : indique les noms des fichiers nayant pas t mis jour, activant ainsi le dclenchement. Disponible comme variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Utilisation

Global Variables

Connections

Liens de sortie (dun composant un autre) : Row : Main, Iterate.

Guide de Rfrence des Composants Talend Open Studio

1463

Scnario : Attendre la suppression dun fichier

Trigger : OnSubjobOk, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : OnSubjobOk, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio. Limitation n/a

Scnario : Attendre la suppression dun fichier


Ce scnario dcrit un Job permettant de scanner un rpertoire la recherche dun fichier qui sera supprim de ce rpertoire, pour ensuite lancer un sous-Job. Ainsi, lorsquun fichier est supprim, le sous-Job affiche un message indiquant cette suppression.

Ce Job est constitu de deux composants : le tWaitForFile et le tMsgBox. Cliquez et dposez ces composants dans lespace de modlisation et connectez-les laide dun lien Iterate pour effectuer la boucle. Puis slectionnez le composant tWaitForFile, et dans longlet Basic settings de la vue Component, paramtrez les proprits de la condition et de la boucle :

Dans le champ Time (in seconds) between iterations, paramtrez la dure en secondes entre chaque itration. Dans cet exemple, le rpertoire sera scann toutes les 5 secondes. Dans le champ Max. number of iterations (infinite loop if empty), saisissez le nombre ditration effectuer avant que le Job ne soit arrt. Dans cet exemple, le rpertoire est scann 5 fois maximum. Dans le champ Directory to scan, renseignez le chemin daccs au rpertoire devant tre scann.

1464

Guide de Rfrence des Composants Talend Open Studio

Scnario : Attendre la suppression dun fichier

Dans le champ Trigger action when, slectionnez la condition rencontrer pour que le sous-Job soit lanc. Dans cet exemple, la condition est la suppression (ou le dplacement) dun fichier du rpertoire. Dans le champ Then, slectionnez laction effectuer lorsque la condition est rencontre avant que le nombre ditrations dfini ne soit atteint. Dans cet exemple, la boucle sarrte ds que la condition est rencontre. Puis dfinissez le sous-Job effectuer lorsque la condition est rencontre. Dans cet exemple, le sous-Job affiche une bote de dialogue. Slectionnez le composant tMsgBox, et dans longlet Basic settings de la vue Component, saisissez le message afficher. Dans les champs Title et Message, renseignez le titre et le message. Dans les champs Buttons et Icon, renseignez le type de boutons et dicnes utiliser.

Dans le champ Message, vous pouvez saisir nimporte quel type de message que vous souhaitez faire apparatre et utiliser des variables globales disponibles dans la liste dauto-compltion via le raccourci Ctrl+Espace. Le message de cet exemple est : "Deleted file: "+((String)globalMap.get("tWaitForFile_1_DELETED_FILE"))+" on iteration Nr:"+((Integer)globalMap.get("tWaitForFile_1_CURRENT_ITERATION"))

Excutez le Job via la raccourci F6. Pendant que la boucle seffectue, supprimez un fichier du rpertoire dfini et la bote de dialogue contenant le message dfini apparat.

Guide de Rfrence des Composants Talend Open Studio

1465

tWaitForSocket

tWaitForSocket

Proprits du tWaitForSocket
Famille de composant Fonction Objectif Basic settings Orchestration Le composant tWaitForSocket fait une boucle sur un port dfini la recherche de donnes puis dclenche un sous-job lorsque la condition est rencontre. Ce composant permet de dclencher un Job en fonction dune condition dfinie. Port End of line separator Then Saisissez le numro du port couter. Saisissez le sparateur de fin de ligne de vos donnes. Slectionnez laction effectuer : soit continuer couter le port (keep on listening) soit fermer la connexion (close socket).

Print client/server data Cochez cette case afin dafficher les donnes client ou serveur. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant de dbut (ou de dclenchement) pour le sous-Job excut en fonction de la condition tablie. Ainsi, ce composant doit tre connect un sous-job via un lien Iterate. Client input data : retourne les donnes transmises par le client. Disponible comme variable Flow. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Global Variables

Connections

Liens de sortie (dun composant un autre) : Row : Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide Utilisateur Talend Open Studio.

Limitation

n/a

1466

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Scnario associ
Aucun scnario nest disponible pour ce composant.

Guide de Rfrence des Composants Talend Open Studio

1467

tWaitForSqlData

tWaitForSqlData

Proprit du tWaitForSqlData
Famille de composant Fonction Orchestration Le composant tWaitForSqlData effectue une boucle sur une connexion donne la recherche dun ajout ou dune suppression de lignes, puis dclenche un sousJob lorsque la condition est rencontre. Ce composant permet de dclencher un sous-Job en fonction de la prsence de donnes sql. Wait at each iteration Paramtrez en secondes lintervalle de temps entre (in seconds) chaque vrification. Max. iterations (infinite Nombre de vrifications effectuer avant que le Job ne loop if empty) sarrte (si vous ne saisissez rien, la boucle sera infinie). Use an existing connec- Cochez la case et cliquez sur le composant de connexion tion/Component List adquat dans la liste Component list pour rutiliser les informations de connexion que vous avez dj dfinies. Lorsquun Job contient un Job parent et un Job enfant, la liste Component List prsente uniquement les composants de connexion du Job du mme niveau. Si vous souhaitez utiliser une connexion existant dans un autre niveau, vrifiez que les composants de connexion disponibles partagent la mme connexion. Pour plus dinformations concernant le partage dune connexion travers diffrents niveaux de Jobs, consultez Use or register a shared DB connection dans tous les composants de base de donnes que vous utilisez. Sinon, vous pouvez galement dsactiver le composant de connexion et utiliser les Dynamic settings du composant, afin de paramtrer manuellement la connexion. Dans ce cas, vrifiez que le nom de la connexion est unique et distinct tout au long des deux niveaux de Jobs. Pour plus dinformations concernant les paramtres dynamiques (Dynamic settings), consultez le Guide Utilisateur de votre Studio. Table to scan Nom de la table vrifier. Trigger action when Slectionnez la condition rencontrer pour excuter rowcount is laction : Equal to : gal Not Equal to : diffrent de Greater than : suprieur

Objectif Basic settings

1468

Guide de Rfrence des Composants Talend Open Studio

Scnario : Attendre lajout de lignes dans une table

Lower than : infrieur Greater or equal to : suprieur ou gal Lower or equal to :infrieur ou gal . Value Then Dfinissez la valeur prendre en compte. Slectionnez laction effectuer lorsque la condition est rencontre : soit arrter la boucle (exit loop), soit continuer la boucle jusqu ce que le nombre ditration maximum soit atteint (continue loop).

Utilisation

Bien que ce composant ait besoin dun composant de connexion pour ouvrir laccs une base de donnes, il joue aussi le rle de composant de dbut (ou de dclenchement) pour le sous-Job excuter lorsque la condition est rencontre. Ainsi, ce composant doit tre connect un sous-Job via un lien Iterate. Current iteration : indique le nombre ditrations. Disponible comme variable Flow. Retourne un entier. Row count : indique le nombre denregistrements dtects dans la table. Disponible comme variable Flow. Retourne un entier. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur Talend Open Studio.

Global Variables

Limitation

n/a

Scnario : Attendre lajout de lignes dans une table


Ce scnario dcrit un Job lisant la table dune base de donnes dans lattente dun ajout de donnes dans cette table, pour ensuite excuter un sous-Job. Lorsque des donnes sont ajoutes, le sous-Job effectue un Select* sur la table et affiche le contenu des donnes insres dans la console standard. s

Cliquez et dposez les composants suivants de la Palette dans lespace de modlisation : tMysqlConnection, tWaitForSqlData, tMysqlInput, tLogRow. Connectez le composant tMysqlConnection au composant tWaitforSqlData laide un lien OnSubJobOK, disponible via le clic-droit. Puis connectez le composant tWaitForSqlData au sous-Job laide dun lien Iterate puisquaucune donne nest transfre pour le moment. En effet, le tWaitForSqlData effectue seulement des boucles jusqu ce que la condition soit rencontre. Dans le sous-Job excuter si la condition est rencontre, le composant tMysqlInput est connect au tLogRow. Puisque cette connexion sert transfrer des donnes, utilisez un lien de type Row main.

Guide de Rfrence des Composants Talend Open Studio

1469

Scnario : Attendre lajout de lignes dans une table

Maintenant, paramtrez la connexion la table devant tre vrife intervalles rguliers. Dans longlet Basic Settings de la vue Component du composant tMySqlConnection, paramtrez les proprits de connexion la base de donnes.

Renseignez les champs Host, Port, Database, Username, Password pour ouvrir une connexion la base de donnes. Pour plus dinformations, consultez les composants de connexion aux bases de donnes. Par exemple, pour une base de donnes Mysql, consultez la section intitule tMysqlConnection Dans le champ Encoding, slectionnez lencodage adquat, si ncessaire. Puis slectionnez le composant tWaitForSqlData, et dans longlet Basic Settings de la vue Component, paramtrez ses proprits. Dans le champ Wait at each iteration, paramtrez en secondes lintervalle entre chaque itration.

Dans le champ Max iterations, saisissez le nombre ditrations maximum effectuer avant que le Job ne sarrte. Pour utiliser le composant tWaitForSqlData, il faut quune connexion soit ouverte pour effectuer le nombre de boucles dfini. Slectionnez la connexion adquate (sil y en a plusieurs) dans la liste droulante Component List. Dans le champ Table to scan, saisissez le nom de la table scanner. Dans cet exemple : test_datatypes. Dans les champs Trigger action when rowcount is et Value, slectionnez la condition rencontrer afin de lancer le sous-Job. Pour cet exemple, le nombre de lignes prendre en compte dans la table scanne soit tre suprieur ou gal 1, ainsi slectionnez be greater or equal to 1. Dans le champ Then, slectionnez laction effectuer lorsque la condition est rencontre avant que le nombre maximum ditrations dfini ne soit atteint. Dans cet exemple, ds que la condition est rencontre, la boucle devrait sarrter. Puis paramtrez le sous-Job excuter lorsque la condition est rencontre. Dans cet exemple, le sous-Job slectionne les donnes de la table scanne et les affiche dans le console. Slectionnez le composant tMysqlInput, et dans longlet Basic Settings de la vue Component, paramtrez la connexion la table.

1470

Guide de Rfrence des Composants Talend Open Studio

Scnario : Attendre lajout de lignes dans une table

Si la connexion est stocke dans le Repository, slectionnez-la dans la liste droulante. Sinon, cochez la case Use an existing connection et slectionnez le composant de connexion correspondant dans la liste. Dans cet exemple, le schma correspondant la structure de la table est stock dans le Repository. Dans le champ Table Name, renseignez le nom de la table partir de laquelle les donnes seront extraites, Test_datatypes. Puis dans le champ Query, saisissez la commande Select permettant dextraire le contenu de la table. Pour cet exemple, laissez les proprits par dfaut du composant tLogRow. Avant dexcuter le Job, assurez-vous que la table scanner (test_datatypes) est bien vide, afin que la condition (greater or equal to 1) soit rencontre. Puis excutez le Job via le raccourci F6. Avant la fin de la boucle, ajoutez une ou deux lignes la table test_datatypes afin que la condition soit rencontre.

Le Job sarrte lorsque les donnes ajoutes la table sont dtectes lors de la boucle et le contenu de la table est affich dans la console.

Guide de Rfrence des Composants Talend Open Studio

1471

Guide de Rfrence des Composants Talend Open Studio

Composants Processing
Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille Processing de la Palette de Talend Open Studio. La famille Processing regroupe les composants vous permettant deffectuer diffrents types de traitement de flux de donnes, notamment lagrgation, le mapping, la transformation, la dnormalisation, le filtrage, etc.

Guide de Rfrence des Composants Talend Open Studio

tAggregateRow

tAggregateRow

Proprits du tAggregateRow
Famille de composant Fonction Processing Le composant tAggregateRow reoit un flux de donnes et fait une agrgation base sur une ou plusieurs colonnes. Pour chacune des lignes en sortie, une cl dagrgation est fournie, ainsi que le rsultat de lopration dagrgation correspondant (min, max, sum, etc.). Il permet dtablir des mtriques et des statistiques bases sur des valeurs ou des calculs. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que lorsque vous modifiez le schma, il se met automatiquement en built-in. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement leGuide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Group by Dfinit les ensembles dagrgation, dont les valeurs sont utilises pour les calculs. Output Column : Slectionnez le libell de colonne dans la liste fournie, base sur la structure de schma que vous avez dfinie. Vous pouvez ajouter autant de colonnes de sortie que vous le souhaitez afin daffiner les agrgations. Ex : Slectionnez Country (Pays) pour calculer la moyenne des valeurs pour chaque pays ou slectionnez Country et Region pour comparer les rsultats des rgions dun pays par rapport aux rgions dun autre pays. Input Column : Faites la correspondance entre les libells des colonnes dentre avec ceux des colonnes de sortie, dans le cas o vous souhaitez que les libells du schma de sortie soient diffrents du schma dentre. Operations Slectionnez le type dopration effectuer ainsi que la valeur utiliser pour le calcul et le champ de sortie. Output Column : Slectionnez le champ de destination dans la liste.

Objectif Basic settings

1474

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAggregateRow

Fonction : Slectionnez loprateur parmi : count : calcule le nombre de ligne, min : slectionne la plus petite valeur, max : slectionne la plus grande valeur, avg : calcule la moyenne, sum : calcule la somme, first : retourne la premire valeur, last : retourne la dernire valeur, list : liste les valeurs dune agrgation de plusieurs cls. list (object) : liste les valeurs Java dune agrgation de plusieurs cls, count (distinct) : compte le nombre de lignes sans les doublons, standard deviation : calcule lcart-type. Input column position : Slectionnez la colonne dentre partir de laquelle les valeurs sont collectes pour lagrgation. Ignore null values : Cochez cette case devant le nom de toutes les colonnes pour lesquelles vous voulez que les valeurs nulles soient ignores. Advanced settings Delimiter(only for list Saisissez le sparateur que vous souhaitez utiliser afin de operation) sparer les diffrentes oprations. Use financial precision, Cochez cette case afin dutiliser une prcision financire, this is the max precision une prcision maximale, mais qui consomme plus de mfor sum and avg moire et rend le processus plus lent. operations, checked opNous vous conseillons dutiliser le type BigDetion heaps more memocimal en sortie avec cette option, afin dobtenir ry and slower than undes rsultats prcis. checked. Check type overflow Vrifie les types des donnes afin dviter que le Job ne (slower) plante Check ULP (Unit in the Cochez cette case afin davoir la meilleure prcision posLast Place), ensure that sible pour les types Float et Double. a value will be incremented or decremented correctly, only float and double types. (slower) tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant intermdiaire car il traite un flux de donnes, par consquent il requiert des composants en entre comme en sortie. Gnralement, lutilisation du composant tAggregateRow est combine au composant tSortRow. n/a

Limitation

Guide de Rfrence des Composants Talend Open Studio

1475

Scnario : Agrger des valeurs et trier des donnes

Scnario : Agrger des valeurs et trier des donnes


Le scnario suivant dcrit un Job quatre composants. Le composant dentre, un fichier dlimit CSV, contient des noms de pays et des valeurs de notation trier par ordre dcroissant de moyenne. Ce composant dentre est connect un oprateur tAggregateRow qui se charge de calculer les moyennes puis un composant tSortRow qui se charge du tri. Le flux de sortie est dirig dans un nouveau fichier CSV.

A partir du dossier File de la Palette, cliquez et dposez un composant tFileInputDelimited. Cliquez sur le libell du composant et renommez-le en Countries. Ou passez dans longlet View pour le changer. Dans longlet Basic settings, dfinissez le chemin daccs ainsi que les critres de dlimitation. Ou slectionnez lentre de mtadonnes correspondant votre fichier dentre, si vous en avez dfini une. Cliquez sur Edit schema... et paramtrez les colonnes : Countries et Points correspondant la structure du fichier. Si la description du fichier est conserve dans les Metadata du Repository, le schma est automatiquement charg lorsque vous cliquez sur Repository dans le champ Schema. Puis dans le dossier Processing de la Palette, cliquez et dposez le composant tAggregateRow. Renommez-le en Calculation. Cliquez-droit et connectez Countries Calculation laide dune connexion Row > Main. Double-cliquez sur Calculation (composant tAggregateRow) pour dfinir les proprits. Cliquez sur Edit schema et dfinissez le schma de sortie. Vous pouvez ajouter autant de colonnes que vous le voulez selon le nombre doprations densemble que vous souhaitez obtenir en sortie.

Dans cet exemple, calculez la moyenne de la notation par pays et affichez les valeurs minimale et maximale par pays, sachant que chaque pays possde plusieurs notes. Cliquez sur OK lorsque le schma est termin. Dfinissez prsent les diffrentes oprations densemble effectuer. Dans le champ Group By de la fentre Basic settings du composant tAggregateRow, dfinissez les ensembles sur lesquels les oprations sont effectues. Dans cet exemple, slectionnez Country comme colonne de regroupement. Notez que dans la colonne de

1476

Guide de Rfrence des Composants Talend Open Studio

Scnario : Agrger des valeurs et trier des donnes

sortie, un champ cl doit tre dfini dans le schma. La premire colonne cite comme de sortie (Output) dans la table Group By devient lensemble principal de calcul. Toutes les autres sorties deviennent alors secondaires dans lordre daffichage. Slectionnez la colonne dentre (Input) dont sont extraites les valeurs. Puis renseignez les diverses oprations ralises. Les fonctions utilises dans cet exemple sont des moyennes (average), min, max. Slectionnez la colonne dentre dont sont extraites les valeurs de calcul et slectionnez les cases Ignore null values si ncessaire.

Cliquez-dposez un composant tSortRow dans lespace de modlisation. Pour plus dinformations concernant ce composant, consultez la section intitule Proprits du tSortRow Connectez-le au composant tAggregateRow laide dune connexion de type Row > Main. Dans la vue Component du composant tSortRow, dfinissez la colonne de tri, le type ainsi que lordre de tri.

Dans ce scnario, la colonne trier est Country, le type de tri est alphabtique et lordre est ascendant. Ajoutez un composant de sortie ce Job. Cliquez et dposez un composant tFileOutputDelimited et paramtrez-le. Connectez le composant tSortRow ce composant de sortie.

Guide de Rfrence des Composants Talend Open Studio

1477

Scnario : Agrger des valeurs et trier des donnes

Dans la vue Component, saisissez le chemin daccs au fichier de sortie. Cliquez sur Edit schema pour le configurer si ncessaire. Dans ce scnario, le fichier dlimit est de type CSV. Cochez la case Include Header afin de rutiliser les libells des colonnes du schma dans le flux de sortie. Appuyez sur F6 pour excuter le Job. Le fichier CSV est ainsi cr et il contient les rsultats des oprations dagrgation.

1478

Guide de Rfrence des Composants Talend Open Studio

tAggregateSortedRow

tAggregateSortedRow

Proprits du tAggregateSortedRow
Famille du composant Fonction Processing Le composant tAggregateSortedRow reoit un flux de donnes tries sur lequel il effectue une agrgation base sur une ou plusieurs colonnes. La cl dagrgation et les rsultats pertinents des oprations (min, max, sum, etc.) sont dispenss pour chaque ligne de sortie. Le tAggregateSortedRow vous permet de rcuprer un chantillon de mtriques reposant sur des valeurs ou des calculs. Etant donn que les donnes du flux dentre sont supposes tre dj tries, les performances nen sont que plus optimises. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que lorsque vous modifiez le schma, il se met automatiquement en built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent connect dans le Job. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job Designs. Voir galement le Guide utilisateur de Talend Open Studio. Input rows count Spcifiez le nombre de lignes envoy au composant tAggregateSortedRow. Si vous spcifiez une limite (dans le champ Limit) au nombre de lignes traiter dans le composant dentre, vous devez utiliser cette mme limite dans le champ Input rows count. Group by Dfinit les ensembles dagrgation, dont les valeurs sont utilises pour les calculs. Output Column : Slectionnez le libell de colonne dans la liste fournie, base sur la structure de schma que vous avez dfinie. Vous pouvez ajouter autant de colonnes de sortie que vous le souhaitez afin daffiner les agrgations.

Objectif

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1479

Scnario associ

Ex : Slectionnez Country (Pays) pour calculer la moyenne des valeurs pour chaque pays ou slectionnez Country et Region pour comparer les rsultats des rgions dun pays par rapport aux rgions dun autre pays. Input Column : Faites la correspondance entre les libells des colonnes dentre avec ceux des colonnes de sortie, dans le cas o vous souhaitez que les libells du schma de sortie soient diffrents du schma dentre. Operations Slectionnez le type dopration effectuer ainsi que la valeur utiliser pour le calcul et le champ de sortie. Output Column : Slectionnez le champ de destination partir de la liste droulante. Function : Choisissez loprateur parmi : count, min, max, avg, first, last. Input column position : Slectionnez la colonne dentre partir de laquelle les valeurs sont rcupres avant dtre agrges. Ignore null values : Cochez cette case devant le nom de toutes les colonnes pour lesquelles vous voulez que les valeurs nulles soient ignores. Utilisation Limitation Ce composant traite des flux de donnes, il ncessite donc des composants dentre et sortie. Il est donc dfini en tant que composant intermdiaire. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Agrger des valeurs et trier des donnes du composant tAggregateRow.

1480

Guide de Rfrence des Composants Talend Open Studio

tConvertType

tConvertType

Proprits du tConvertType
Famille de composant Fonction Objectif Processing Le composant tConvertType permet deffectuer des conversions spcifiques du type de donnes Java vers un autre type de donnes Talend au cours de lexcution. Le composant tConvertType permet de convertir automatiquement des donnes de type Java vers un autre type utilis par Talend, ce qui permet dviter les erreurs de compilation. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que lorsque vous modifiez le schma, il se met automatiquement en built-in. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs designs. Voir galement leGuide Utilisateur de Talend Open Studio. Auto Cast Manual Cast Cette case est coche par dfaut. Elle permet de convertir automatiquement des donnes de type Java. Ce mode nest pas visible si la case Auto Cast est coche. Elle permet de prciser manuellement les colonnes o une conversion de type Java est ncessaire.

Basic settings

Set empty values to Null Cochez cette case pour dfinir les valeurs des lments before converting de type String ou Object comme null pour les donnes d'entre. Die on error Advanced settings Utilisation Limitation tStatCatcher Statistics Cette case est coche pour arrter le Job lorsque survient une erreur. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant ne peut tre utilis comme composant de dbut. Il requiert un flux dentre pour fonctionner. n/a

Guide de Rfrence des Composants Talend Open Studio

1481

Scnario : Convertir des types de donnes Java

Scnario : Convertir des types de donnes Java


Le scnario Java suivant permet de crer un Job quatre composants dans lequel le tConvertType est utilis pour convertir des donnes de type Java stockes dans trois colonnes diffrentes et le tMap est utilis pour modifier le schma : la premire colonne reste intacte et les deux dernires colonnes du schma dentre sont fusionnes en une seule colonne dans le schma de sortie. Dans ce scnario, le schma du fichier dlimit utilis en entre est stock dans le Repository, vous pouvez donc renseigner les proprits du composant tFileInputDelimited dun simple glisser-dposer du rpertoire Repository > Metadata > File delimited vers lespace de modlisation. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio. Cliquez et dposez les composants suivants dans lespace de modlisation : tConvertType, tMap et tLogRow. Dans le Repository, dveloppez les noeuds Metadata > File Delimited et glissez-dposez la mtadonne correspondante dans lespace de modlisation. Pour ce scnario, JavaTypes. La bote de dialogue [Components] apparat. Dans la bote de dialogue, slectionnez le tFileInputDelimited dans la liste des composants et cliquez sur Ok. Un composant tFileInputComponent appel Java types apparat dans lespace de modlisation. Connectez les composants laide de liens Row Main.

Dans lespace de modlisation, slectionnez le composant tFileInputDelimited et cliquez sur la vue Component pour paramtrer ses proprits de base. Dans longlet Basic settings, slectionnez loption Repository dans la liste Property Type puisque les proprits du fichier sont stockes dans le Repository. Les autres champs sont alors renseigns automatiquement grce aux donnes rcupres.

Le fichier dentre utilis pour ce scnario est un fichier texte appel input contenant des donnes Java de type string (chane de caractres), integer (entier) et float.

1482

Guide de Rfrence des Composants Talend Open Studio

Scnario : Convertir des types de donnes Java

Dans la vue Basic settings, renseignez les autres champs, si ncessaire. Pour plus dinformations, consultez la section intitule Proprits du tMDMInput . Dans ce scnario, il ny a ni en-tte ni pied de page et il ny a pas de nombre limite de lignes traiter. Cliquez sur Edit schema pour dcrire la structure des donnes du fichier dentre. Dans ce scnario, le schma est compos de trois colonnes : StringtoInteger, IntegerField et FloatToInteger.

Cliquez sur OK pour fermer la bote de dialogue. Dans lespace de modlisation, slectionnez le tConvertType et cliquez sur la vue Component pour paramtrer ses proprits de base.

Dans la liste Schema Type, slectionnez loption Built in et cliquez sur le bouton Sync columns pour rcuprer automatiquement les colonnes du composant tFileInputDelimited. Si ncessaire, cliquez sur Edit schema pour dcrire manuellement la structure des donnes de ce composant de traitement.

Dans ce scnario, lobjectif est de convertir les donnes de type string (chane de caractres) en integer (entier) et des donnes de type float en integer. Cliquez sur OK pour fermer la bote de dialogue [Schema of tConvertType].

Guide de Rfrence des Composants Talend Open Studio

1483

Scnario : Convertir des types de donnes Java

Dans lespace de modlisation, double-cliquez sur le tMap pour ouvrir lditeur du tMap. Lditeur du tMap souvre et affiche les noms des colonnes du fichier dentre.

Dans longlet Schema editor en bas de lditeur du tMap, cliquez sur le bouton [+] de la table de sortie pour ajouter deux lignes et nommez-les StringToInteger et Sum. Dans lditeur du tMap, glissez la ligne StringToInteger de la table dentre vers la ligne StringToInteger de la table de sortie. Dans lditeur du tMap, glissez les lignes IntegerField et FloatToInteger de la table dentre vers la ligne Sum de la table de sortie. Cliquez sur OK pour fermer lditeur du tMap.

1484

Guide de Rfrence des Composants Talend Open Studio

Scnario : Convertir des types de donnes Java

Dans lespace de modlisation, slectionnez le tLogRow et cliquez sur la vue Component pour paramtrer ses proprits de base. Pour plus dinformations, consultez la section intitule tLogRow . Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Les donnes de type string sont converties en integer et affiches dans la colonne StringToInteger dans la console. Les donnes de type float sont converties en integer et ajoutes la valeur IntegerField et leur somme est affiche dans la colonne Sum dans la console.

Guide de Rfrence des Composants Talend Open Studio

1485

tDenormalize

tDenormalize

Proprits du tDenormalize
Famille de composant Fonction Objectif Basic settings Processing/Fields Le composant tDenormalize dnormalise un flux entrant en fonction dune colonne. Le tDenormalize permet de synthtiser un flux entrant. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. To denormalize Ce tableau vous permet de choisir les paramtres de dnormalisation des colonnes. Column : Slectionnez la colonne dnormaliser. Delimiter : Saisissez, entre guillemets doubles, le sparateur que vous souhaitez utiliser. Merge same value : Cochez cette case si vous voulez fusionner les valeurs identiques. Column to denormalize Slectionnez la colonne du flux entrant sur laquelle est base la dnormalisation (inclus dans la cl). Group by Slectionnez une ou plusieurs colonnes regrouper. Nous vous conseillons de supprimer du schma les colonnes qui ne sont pas utilises avant de procder au traitement. Renseignez le sparateur dlimitant les donnes du flux dnormalis. Supprime les doublons lorsque les valeurs dnormalises sont concatnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Item Separator Advanced settings Deduplicate items tStatCatcher Statistics Utilisation Limitation

Ce composant peut tre utilis en tape intermdiaire dans un flux de donnes. Notez que ce composant peut changer lordre du flux Java entrant.

Scnario 1 : Dnormaliser une colonne


Ce scnario illustre un Job dnormalisant une colonne dun fichier dlimit via un composant de dnormalisation, et affichant le rsultat dans la console.

1486

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Dnormaliser une colonne

Cliquez et dposez les composants suivants : tFileInputDelimited, tDenormalize, tLogRow. Connectez ces composants laide dun lien Row main. Dans la vue Component du composant tFileInputDelimited, renseignez le chemin daccs au fichier dnormaliser.

Dans les champs Header, Row Separator et Field Separator, renseignez respectivement le nombre de lignes den-tte, le type de sparateur de lignes et de champs. Le fichier dentre est compos de deux colonnes : Fathers et Children.

Dans longlet Basic settings du tDenormalize, paramtrez la colonne contenant des valeurs multiples regrouper. Dans le tableau To denormalize, slectionnez la colonne Children. Dans cet exemple, la colonne Children est celle dnormaliser.

Guide de Rfrence des Composants Talend Open Studio

1487

Scnario 2 : Dnormaliser plusieurs colonnes

Dans le champ Delimiter, paramtrez le sparateur des valeurs regroupes. Attention, une seule colonne peut tre dnormalise. Cochez la case Merge same value si vous souhaitez supprimer les ventuels doublons. Enregistrez le Job et excutez-le en appuyant sur F6.

Toutes les valeurs de la colonne Children (dfinie comme colonne dnormaliser) sont regroupes en fonction des valeurs de la colonne Fathers. Les valeurs sont spares par des virgules.

Scnario 2 : Dnormaliser plusieurs colonnes


Ce scnario illustre un Job dnormalisant deux colonnes dun fichier dlimit via un composant de dnormalisation et affichant le rsultat dans la console.

Cliquez et dposez les composants suivants : tFileInputDelimited, tDenormalize, tLogRow. Connectez tous les composants laide dune connexion Row > main. Dans longlet Basic settings du composant tFileInputDelimited, renseignez le chemin daccs au fichier dnormaliser.

1488

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Dnormaliser plusieurs colonnes

Renseignez les autres champs, dont les champs Row Separator, Field separators et Header contenant respectivement les sparateurs de lignes et de champs et le nombre de lignes den-tte. Le schma du fichier est compos de quatre colonnes : Name, FirstName, HomeCity, WorkCity.

Dans longlet Basic settings du composant tDenormalize, slectionnez les colonnes contenant les rptitions. Elles correspondent aux colonnes apparaissant plusieurs fois dans le document. Dans cet exemple, FirstName, HomeCity et WorkCity sont les colonnes partir desquelles la dnormalisation est effectue. Ajoutez autant trois lignes la table To denormalize que vous le souhaitez en cliquant sur le bouton [+]. Puis slectionnez les colonnes FirstName, HomeCity et WorkCity dans la liste droulante.

Dans la colonne Delimiter, paramtrez les dlimiteurs en les saisissant entre guillemets, afin de sparer les valeurs concatnes. Pour la colonne FirstName, saisissez #, pour la colonne HomeCity, saisissez , et pour la colonne WorkCity, saisissez .

Guide de Rfrence des Composants Talend Open Studio

1489

Scnario 2 : Dnormaliser plusieurs colonnes

Enregistrez le Job et excutez-le, en appuyant sur F6.

Le rsultat affiche les valeurs dnormalises concatnes laide des sparateurs. Dans longlet Basic settings du composant tDenormalize, dans le tableau To denormalize, cochez la case Merge same value pour fusionner les valeurs identiques. Enregistrez le Job et excutez-le en appuyant sur F6.

Cette fois-ci, la console affiche les rsultats sans doublon.

1490

Guide de Rfrence des Composants Talend Open Studio

tDenormalizeSortedRow

tDenormalizeSortedRow

Proprits du tDenormalizeSortedRow
Famille du composant Fonction Processing/Fields Le composant tDenormalizeSortedRow rassemble dans un groupe toutes les lignes dentre dnormalises tries ainsi que leurs valeurs distinctes, associes par des sparateurs de champ. Le tDenormalizeSortedRow permet de synthtiser les lignes dentre tries afin de faire des conomies de mmoire. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement leGuide utilisateur de Talend Open Studio. Input rows count To denormalize Utilisation Limitation Renseignez le nombre de lignes dentre. Renseignez le nom de la colonne dnormaliser.

Objectif Basic settings

Ce composant traite des flux de donnes, il ncessite donc un composant dentre et un composant de sortie. n/a

Scnario : Regrouper des lignes tries


Ce scnario Java dcrit un Job quatre composants. Il permet de lire un fichier dlimit donn ligne par ligne, de trier les donnes dentres en fonction de leur type et de leur ordre, de dnormaliser toutes les lignes dentres tries et enfin dafficher le rsultat dans la console de log Run. A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : le tFileInputDelimited, le tSortRow, le tDenormalizeSortedRow et le tLogRow. Connectez les quatre composants laide de liens de type Row Main.

Guide de Rfrence des Composants Talend Open Studio

1491

Scnario : Regrouper des lignes tries

Dans lditeur graphique, slectionnez le composant tFileInputDelimited. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFileInputDelimited.

Dfinissez le champ Property Type en mode Built-In. Renseignez le chemin daccs au fichier traiter dans le champ File Name. Dans cet exemple, on utilise le fichier name_list, qui comporte deux colonnes, id et first name.

Dfinissez si ncessaire les sparateurs de lignes et de champs, len-tte et le pied-de-page, ainsi que le nombre de lignes traites. Dfinissez le champ Schema en mode Built in puis cliquez sur le bouton [...] ct du champ Edit Schema pour dfinir les donnes passer au composant suivant. Dans cet exemple, le schma est constitu de deux colonnes, id et name.

1492

Guide de Rfrence des Composants Talend Open Studio

Scnario : Regrouper des lignes tries

Dans lespace graphique, slectionnez le composant tSortRow. Cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings) du tSortRow.

Dfinissez le champ Schema Type en mode Built-In puis cliquez sur Sync columns pour rcuprer le schma partir du composant tFileInputDelimited. Dans le panneau Criteria, cliquez sur le bouton [+] pour ajouter une ligne puis dfinissez les paramtres de tri pour la colonne du schma traiter. Dans cet exemple, on veut trier la colonne id dans lordre croissant. Dans lespace graphique, slectionnez le composant tDenormalizeSortedRow. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tDenormalizeSortedRow.

Dfinissez le champ Schema en mode Built-In puis cliquez sur Sync columns pour rcuprer le schma partir du schma du composant tSortRow.

Guide de Rfrence des Composants Talend Open Studio

1493

Scnario : Regrouper des lignes tries

Dans le champ Input rows count, saisissez le nombre de lignes dentre traiter ou cliquez simultanment sur Ctrl+Espace pour accder la liste des variables de contexte puis slectionnez la variable : tDenormalizeSortedRow_1.NB_LINE Dans le panneau To denormalize, cliquez sur le bouton [+] pour ajouter une ligne puis dfinissez les paramtres de la colonne dnormaliser. Dans cet exemple, on veut dnormaliser la colonne name. Dans lditeur graphique, slectionnez le composant tLogRow puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Pour plus dinformations sur le tLogRow, consultez la section intitule tLogRow . Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Le rsultat affich sur la console montre la faon dont la colonne name a t dnormalise.

1494

Guide de Rfrence des Composants Talend Open Studio

tExternalSortRow

tExternalSortRow

Proprits du tExternalSortRow
Famille du composant Fonction Processing Le composant tExternalSortRow utilise une application externe de tri pour trier les donnes dentre dune ou plusieurs colonnes, en fonction de leur type et de leur ordre. Le tExternalSortRow permet dtablir des mtriques et des tables de classification. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. File Name Nom du fichier traiter. Voir galement le Guide Utilisateur de Talend Open Studio. Field separator Caractre, chane ou expression rgulire sparant les champs.

Objectif Basic settings

External command Renseignez le chemin daccs au fichier externe contesort path nant lalgorithme de tri utiliser. Criteria Cliquez sur [+] pour ajouter autant de lignes que ncessaire pour mettre en place le tri. La premire colonne dfinie dans le schma est slectionne par dfaut. Schema column : Slectionnez la colonne de votre schma sur laquelle vous souhaitez baser votre tri. Notez que lordre est important car il dtermine la priorit de tri. Sort type : Numrique ou Alphabtique. Order : Ordre ascendant ou descendant. Advanced settings Maximum memory Renseignez la taille de la mmoire physique que vous voulez allouer au processus de tri.

Guide de Rfrence des Composants Talend Open Studio

1495

Scnario associ

Temporary directory

Dfinissez lendroit o stocker les fichiers temporaires.

Set temporary input file Cochez la case pour afficher le champ dans lequel vous directory pouvez spcifier le rpertoire du fichier dentre temporaire. Add a dummy EOF line Cochez cette case lorsque vous utilisez le composant tAggregateSortedRow. tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant traite des flux de donnes, il ncessite donc un composant dentre et un composant de sortie. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule tSortRow .

1496

Guide de Rfrence des Composants Talend Open Studio

tExtractDelimitedFields

tExtractDelimitedFields

Proprits du tExtractDelimitedFields
Famille du composant Fonction Objectif Basic settings Processing/Fields Le composant tExtractDelimitedFields gnre des colonnes multiples partir dune colonne donne dans un fichier dlimit. Le tExtractDelimitedFields permet dextraire les champs partir dune chane de caractres, pour les crire un autre endroit par exemple. Field to split Field separator Slectionnez partir de la liste le champ sparer. Dfinissez le sparateur de champs. La syntaxe regex utilise un certain nombre de caractres spciaux comme oprateurs. Si vous utilisez lun de ces oprateurs comme sparateur de champs, il est ncessaire de protger le caractre par un double backslash. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Advanced settings Advanced separator(for Cochez cette option pour modifier les sparateurs utiliss number) pour les nombres. Trim columns Cochez cette case pour supprimer les espaces en dbut et en fin de champ dans les colonnes slectionnes.

Check each row struc- Cochez cette case pour synchroniser chaque ligne avec ture against schema le schma dentre.

Guide de Rfrence des Composants Talend Open Studio

1497

Scnario : Extraire des champs partir dun fichier dlimit par des virgules

Validate date tStatCatcher Statistics Utilisation

Cochez cette case pour vrifier strictement le format de la date par rapport au schma dentre. Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Ce composant traite des flux de donnes, il ncessite donc un composant dentre et un composant de sortie. Il permet d'extraire des donnes d'un champ dlimit l'aide d'un lien Row > Main, et permet de crer un flux de rejet avec un lien Row > Reject, filtrant les donnes dont le type ne correspond pas au type dfini. n/a

Limitation

Scnario : Extraire des champs partir dun fichier dlimit par des virgules
Ce scnario Java dcrit un Job trois composants o le composant tExtractdelimitedFields est utilis pour extraire deux colonnes partir dun fichier dlimit par des virgules. A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : le tFileInputDelimited, le tExtractDelimitedFields et le tLogRow. Effectuez un clic-droit sur chacun des trois composants pour les connecter laide de liens Row Main.

Dans lespace graphique, slectionnez le composant tFileInputDelimited. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFileInputDelimited. Dans longlet Basic settings, dfinissez le champ Property Type en mode Built-In. Cliquez sur le bouton [...] ct du champ File Name pour dfinir le chemin daccs au fichier dentre. Le champ File Name est obligatoire.

Dans ce scnario, on utilise le fichier dentre test5. Il sagit dun fichier texte dont certaines donnes sont spares par des virgules.

1498

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire des champs partir dun fichier dlimit par des virgules

Dans longlet Basic settings, renseignez les autres champs. Pour plus dinformations, consultez la section intitule Proprits du tMDMInput . Dans ce scnario, len-tte et le pied-de-page ne sont pas dfinis et aucune limite nest renseigne concernant le nombre de lignes traites. Cliquez sur Edit schema pour dcrire la structure des donnes du fichier dentre. Dans ce scnario, le schma est compos dune seule colonne, name.

Dans lespace graphique, slectionnez le composant tExtractDelimitedFields. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tExtractDelimitedFields.

A partir de la liste droulante Field to split, slectionnez la colonne dissocier. Dans ce scnario, il sagit de la colonne name. Dans le champ Field separator, renseignez le sparateur de champs correspondant. Cliquez sur Edit schema pour dcrire la structure des donnes de ce composant de traitement. Dans le panneau de sortie de la bote de dialogue [Schema of tExtractDelimitedFields], cliquez sur le bouton [+] pour ajouter deux colonnes, firstname et lastname, au schma de sortie.

Guide de Rfrence des Composants Talend Open Studio

1499

Scnario : Extraire des champs partir dun fichier dlimit par des virgules

Dans ce scnario, on veut sparer la colonne name en deux colonnes dans le flux de sortie, firstname et lastname. Cliquez sur OK pour fermer la bote de dialogue [Schema of tExtractDelimitedFields]. Dans lespace graphique, slectionnez le composant tLogRow puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Pour plus dinformations, consultez la section intitule tLogRow . Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Les prnoms (firstname) et les noms (lastname) sont extraits et affichs sur la console dans leurs colonnes dfinies correspondantes.

1500

Guide de Rfrence des Composants Talend Open Studio

tExtractPositionalFields

tExtractPositionalFields

Proprits du tExtractPositionalFields
Famille du composant Fonction Objectif Basic settings Processing/Fields Le composant tExtractPositionalFields gnre des colonnes multiples partir dune colonne donne en utilisant des champs positionnels. Le tExtractPositionalFields permet dextraire les donnes dun fichier positionnel selon un modle (pattern). Field Customize Slectionnez dans la liste le champ partir duquel effectuer lextraction. Cochez cette case pour personnaliser le format des donnes du fichier positionnel et renseignez les colonnes du tableau Formats. Column : Slectionnez la colonne que vous souhaitez personnaliser. Size : Saisissez la taille correspondant la colonne. Padding char : Saisissez entre guillemets le caractre de remplissage utilis afin quil soit supprim de votre champ. Le caractre par dfaut est un espace. Alignment : Slectionnez le paramtre dalignement appropri. Pattern Renseignez le modle utiliser pour lextraction. Un modle est constitu de valeurs de longueur spares par des virgules et interprtes comme une chane de caractres entre guillemets. Assurez-vous que les valeurs saisies dans ces champs correspondent au schma dfini. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent.

Guide de Rfrence des Composants Talend Open Studio

1501

Scnario associ

Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Advanced settings Advanced separator(for Cochez cette option pour modifier les sparateurs utiliss number) pour les nombres. Trim Column Cochez cette case afin de supprimer les espaces en dbut et en fin de champ, dans toutes les colonnes.

Check each row struc- Cochez cette case pour synchroniser chaque ligne avec ture against schema le schma dentre. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Ce composant traite des flux de donnes, il ncessite donc un composant dentre et un composant de sortie. Il permet d'extraire des donnes d'un champ dlimit l'aide d'un lien Row > Main, et permet de crer un flux de rejet avec un lien Row > Reject, filtrant les donnes dont le type ne correspond pas au type dfini. n/a

Limitation

Scnario associ
Pour un scnario associ, consultez la section intitule tExtractRegexFields .

1502

Guide de Rfrence des Composants Talend Open Studio

tExtractRegexFields

tExtractRegexFields

Proprits du tExtractRegexFields
Famille du composant Fonction Purpose Basic settings Processing/Fields Le composant tExtractRegexFields gnre des colonnes multiples partir dune colonne donne en utilisant des correspondances regex. Le tExtractRegexFields permet dutiliser des expressions rgulires pour extraire les donnes selon un modle. Field to split Regex Slectionnez dans la liste le champ (ou colonne) sparer. Renseignez lexpression rgulire en fonction du langage de programmation que vous utilisez.

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Advanced settings Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject.

Check each row struc- Cochez cette case pour synchroniser chaque ligne avec ture against schema le schma dentre. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du Job, ainsi quau niveau de chaque composant.

Ce composant traite des flux de donnes, il ncessite donc un composant dentre et un composant de sortie. Il permet d'extraire des donnes d'un champ dlimit l'aide d'un lien Row > Main, et permet de crer un flux de rejet avec un lien Row > Reject, filtrant les donnes dont le type ne correspond pas au type dfini. n/a

Limitation

Guide de Rfrence des Composants Talend Open Studio

1503

Scnario : Extraire des noms, des domaines et domaines de premier niveau partir dadresses e-mail

Scnario : Extraire des noms, des domaines et domaines de premier niveau partir dadresses e-mail
Ce scnario Java dcrit un Job trois composants dans lequel le tExtractRegexFields est utilis pour dfinir une expression rgulire correspondant lune des colonnes des donnes dentre. Dans ce scnario, il sagit de la colonne email. Le composant tExtractRegexFields est galement utilis pour trouver les correspondances avec ladite expression rgulire. Cette expression comprend des identifieurs de champ permettant de sparer le nom dutilisateur, le nom de domaine ainsi que le nom du domaine de premier niveau pour chaque adresse e-mail. Si ladresse e-mail est valide, ces trois parties sont extraites et affiches sur la console dans trois colonnes diffrentes. Les donnes des deux autres colonnes dentre, id et age, sont galement extraites puis rediriges. A partir de la Palette, cliquez-dposez les composants suivants dans lespace graphique : le tFileInputDelimited, le tExtractRegexFields et le tLogRow. Connectez les trois composants laide de liens Row Main comme ci-dessous.

Dans lespace graphique, cliquez sur le composant tFileInputDelimited. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tFileInputDelimited. A partir de longlet Basic settings, configurez le champ Property Type en mode Built-In. Cliquez sur le bouton [...] ct du champ File Name pour dfinir le chemin daccs au fichier dentre. Le champ File Name est obligatoire.

Dans ce scnario, le fichier dentre utilis est test4. Il sagit dun fichier texte comportant trois colonnes : id, email et age. Renseignez tous les autres champs comme demand. Pour plus dinformations, consultez la section intitule Proprits du tMDMInput . Dans ce scnario, len-tte et le pied-de-page ne sont pas dfinis et aucune limite nest renseigne concernant le nombre de lignes traites. Cliquez sur le bouton [...] du champ Edit schema pour dfinir la structure des donnes du fichier dentre. Dans ce scnario, le schma est compos de trois colonnes, id, email et age. Dans lespace graphique, slectionnez le composant tExtractRegexFields. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tExtractRegexFields.

1504

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire des noms, des domaines et domaines de premier niveau partir dadresses e-mail

A partir de la liste droulante Field to split, slectionnez la colonne sparer, savoir email dans ce scnario. Dans le panneau Regex, renseignez lexpression rgulire utiliser pour effectuer la correspondance. Dans ce scnario, il sagit dune expression rgulire Java.

Cliquez sur Edit schema pour dcrire la structure des donnes du composant de traitement. Dans le panneau Output de la bote de dialogue [Schema of tExtractRegexFields], cliquez sur le bouton [+] pour ajouter cinq colonnes au schma de sortie.

Dans ce scnario, on veut sparer la colonne dentre email en trois colonnes name, domain et tld dans le flux de sortie. Les deux autres colonnes dentre seront extraites telles quelles. Cliquez sur OK pour fermer la bote de dialogue [Schema of tExtractRegexFields]. Dans lespace graphique, slectionnez le composant tLogRow puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Pour plus dinformations, consultez la section intitule tLogRow . Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

1505

Scnario : Extraire des noms, des domaines et domaines de premier niveau partir dadresses e-mail

Le composant tExtractRegexFields effectue une correspondance entre toutes les adresse e-mail donnes et lexpression rgulire dfinie, puis extrait le nom dutilisateur, le domaine et le domaine de premier niveau, quil affiche sur la console dans trois colonnes spares. Les deux autres colonnes, id et age, sont extraites telles quelles.

1506

Guide de Rfrence des Composants Talend Open Studio

tExtractXMLField

tExtractXMLField

tExtractXMLField appartient deux familles de composants : Processing et XML. Pour plus dinformations concernant le composant tExtractXMLField, consultez la section intitule tExtractXMLField .

Guide de Rfrence des Composants Talend Open Studio

1507

tFilterColumns

tFilterColumns

Proprits du tFilterColumns
Famille du composant Fonction Objectif Basic settings Processing Le composant tFilterColumns opre des modifications spcifiques, tablies partir dun mapping du nom des colonnes, sur un schma dfini. Le tFilterColumns permet dhomogniser des schmas, soit en fonction de lordre des colonnes, soit en supprimant ou en ajoutant des colonnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement leGuide Utilisateur de Talend Open Studio. Utilisation Ce composant nest pas un composant de dbut (fond vert) et il ncessite un composant de sortie.

Scnario associ
Pour plus dinformations concernant lutilisation du composant tFilterColumns, consultez la section intitule Scnario : Remplacement mutliple et filtrage de colonnes du composant tReplace.

1508

Guide de Rfrence des Composants Talend Open Studio

tFilterRow

tFilterRow

Proprits du tFilterRow
Famille du composant Fonction Objectif Basic settings Processing Le composant tFilterRow filtre des lignes dentre en dfinissant des conditions sur les colonnes slectionnes. Le composant tFilterRow aide paramtrer les filtres sur les donnes source. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Le schma est en lecture seule. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide Utilisateur de Talend Open Studio. Logical operator used Si vous souhaitez utiliser les modes de filtrage simple et to combine conditions avanc la fois, slectionnez loprateur permettant de combiner les deux modes. Conditions Cliquez sur le bouton [+] pour ajouter autant de conditions que voulu. Les conditions sont excutes les unes aprs les autres pour chaque ligne. Input column : Slectionnez la colonne du schma sur laquelle excuter la fonction. Function : Slectionnez une fonction dans la liste. Operator : Slectionnez loprateur permettant de relier la colonne dentre et la valeur. Value : Renseignez la valeur filtre, entre guillemets si besoin est. Use advanced mode Cochez cette case lorsque lopration effectuer ne peut aboutir grce aux fonctions standard proposes. Dans le champ texte, entrez lexpression rgulire comme demand. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant nest pas un composant de dbut (fond vert) et il ncessite un composant de sortie.

Guide de Rfrence des Composants Talend Open Studio

1509

Scnario : Filtrer une liste de noms et faire une recherche dans la liste

Scnario : Filtrer une liste de noms et faire une recherche dans la liste
Le scnario suivant est un Job Java qui utilise une condition simple et une expression rgulire pour filtrer une liste denregistrements. Le Job crit deux tables de sortie : la premire liste tous les enregistrements de langue italienne dont les prnoms contiennent moins de six caractres et la seconde liste tous les enregistrements rejets. Un message derreur saffichera dans la table pour chaque enregistrement rejet, afin dexpliquer pourquoi lenregistrement a t rejet.

A partir de la Palette, cliquez-dposez les composants suivants dans lditeur graphique : un tFixedFlowInput, un tFilterRow et un tLogRow. Connectez le tFixedFlowInput au tFilterRow laide dun lien Row > Main. Ensuite, connectez le tFilterRow au tLogRow, laide dun lien Row > Filter. Dposez de la Palette dans lespace de modlisation graphique un nouveau tLogRow et renommez-le reject. Reliez le tFilterRow ce tLogRow laide dun lien Row > Reject. Dans lespace graphique, cliquez sur le composant tFixedFlowInput afin dafficher sa vue Basic settings et dfinir ses proprits. Slectionnez loption Use Inline Content(delimited file) dans la zone Mode. Cliquez sur le bouton [...] ct du champ File Name pour dfinir le chemin daccs au fichier dentre.

Renseignez les sparateurs de lignes (Row Separator) et de champs (Field Separator). Le sparateur de lignes est constitu dun retour chariot et le sparateur de champs dun point-virgule. Dans la liste Schema, slectionnez Buil-In. Le schma nest donc pas stock dans le Repository. Cliquez sur le bouton [...] ct du champ Edit schema pour dfinir le schma du fichier dentre. Dans cet exemple, le schma se compose de quatre colonnes : firstname, gender, language et frequency. Dans la colonne Type, slectionnez String pour les trois premires colonnes et Integer pour la colonne frequency.

1510

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer une liste de noms et faire une recherche dans la liste

Cliquez sur OK pour valider et fermer lditeur. Une bote de dialogue souvre et vous demande si vous voulez propager les changements. Cliquez sur Yes (oui). Dans la zone de texte Content, saisissez votre texte en respectant votre schma. Double-cliquez sur le composant tFilterRow pour afficher sa vue Basic settings et dfinir ses proprits.

Dans le tableau Conditions, renseignez les paramtres de filtre sur la colonne firstname. Dans la colonne InputColumn, slectionnez firstname. Dans la colonne Function, slectionnez Length. Dans la colonne Operator, slectionnez Lower than. Dans la colonne Value, saisissez 6 afin de filtrer uniquement les noms dont la longueur est suprieure six caractres. Dans la colonne Value, vous devez saisir vos valeurs entre guillemets doubles pour tous les types de donnes, sauf pour le type Integer, qui nen ncessite pas. Pour implmenter la recherche sur les noms italiens, cochez la case Use advanced mode et saisissez lexpression rgulire suivante, qui comprend le nom de la colonne dans laquelle chercher : input_row.language.equals(italian). Pour combiner les deux conditions, simple et avance, slectionnez loprateur logique And dans la liste Logical operator used to combine conditions. Dans la vue Basic settings des composants tLogRow, slectionnez loption Table (print values in cells of a table) dans la zone Mode. Sauvegardez votre Job puis appuyez sur F6 pour lexcuter.

Guide de Rfrence des Composants Talend Open Studio

1511

Scnario : Filtrer une liste de noms et faire une recherche dans la liste

La premire table liste les enregistrements contenant des prnoms italiens comprenant moins de six caractres et la seconde affiche les enregistrements ne correspondant pas la condition de filtre. A chaque enregistrement rejet correspond un message derreur expliquant la raison du rejet.

1512

Guide de Rfrence des Composants Talend Open Studio

tJoin

tJoin

Proprits du tJoin
Famille de composant Fonction Processing Le tJoin joint deux tables, en appliquant la correspondance exacte dans plusieurs colonnes. Il compare les colonnes du flux principal et les colonnes de rfrence du flux de rfrence (Lookup), et crit les donnes du flux principal et/ou les donnes rejetes. Il aide vrifier la qualit des donnes de nimporte quelle source par rapport une source de donnes de rfrence. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilisable dans divers projets et Job Designs. Voir galement le Guide Utilisateur de Talend Open Studio. Include lookup columns Cochez cette case pour inclure les colonnes de rfrence in output (lookup), que vous avez dfinies, dans le flux de sortie. Key definition Input key attribute Slectionnez la ou les colonne(s) du flux principal qui doivent tre vrifies par rapport la colonne cl de rfrence (lookup). Slectionnez les colonnes cl de rfrence (lookup) que vous utiliserez comme rfrence, afin de les comparer aux colonnes du flux dentre.

Objectif Basic settings

Lookup key attribute

Inner join (with reject Cochez cette case pour joindre dabord les deux tables et output) ensuite rassembler les donnes rejetes du flux principal. Advanced settings tStatCatcher Statistics Cochez cette case pour collecter les mtadonnes de process du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Usage Limitation/prrequis

Ce composant nest pas un composant de dbut (fond vert), il ncessite deux composants dentre, et un ou plusieurs composant(s) de sortie. n/a

Scnario : Faire une correspondance exacte entre deux colonnes et crire les donnes rejetes
Ce scnario Java dcrit un Job cinq composants dont le but est deffectuer une correspondance exacte entre la colonne firstnameClient dun fichier dentre, par rapport aux donnes du fichier de rfrence dentre, et la

Guide de Rfrence des Composants Talend Open Studio

1513

Scnario : Faire une correspondance exacte entre deux colonnes et crire les donnes rejetes

colonne lastnameClient, par rapport aux donnes du fichier dentre de rfrence. Les sorties de cette correspondance sont crites dans des fichiers de sortie distincts : les donnes exactes sont crites dans un fichier Excel, tandis que les donnes inexactes sont crites dans un fichier dlimit. Dans ce scnario, vous avez dj stock les schmas dentre et les fichiers de rfrence dans le Repository. Pour plus dinformations propos du stockage de mtadonnes dans larborescence du Repository, consultez le Guide Utilisateur Talend Open Studio. Dans larborescence du Repository, dveloppez le nud Metadata ainsi que le nud des fichiers (File) o vous avez stock les schmas dentre, et glissez la mtadonne correspondante dans lespace de modlisation graphique. La bote de dialogue [Components] souvre.

Slectionnez tFileInputDelimited dans la liste et cliquez sur OK afin de fermer la bote de dialogue. Le composant tFileInputDelimited apparat dans lespace de modlisation. Le fichier dentre utilis dans ce scnario est appel ClientSample. Il contient quatre colonnes, y compris les deux colonnes firstnameClient et lastnameClient sur lesquelles vous voulez appliquer la correspondance exacte. Rptez lopration pour le deuxime fichier dentre que vous souhaitez utiliser comme rfrence, ClientSample_Update dans ce scnario. Glissez les composants suivants de la Palette dans lespace de modlisation graphique : tJoin, tFileOutputExcel, et tFileOutputDelimited.

1514

Guide de Rfrence des Composants Talend Open Studio

Scnario : Faire une correspondance exacte entre deux colonnes et crire les donnes rejetes

Connectez les fichiers principal et de rfrence au tJoin laide dune connexion de type Row > Main. Le lien principal entre le fichier de rfrence et le tJoin saffiche comme un lien Lookup (de rfrence) dans lespace de modlisation. Connectez le tJoin au tFileOutputExcel laide dune connexion Main, et le tJoin au tFileOutputDelimited avec une connexion Inner join reject. Au besoin, double-cliquez sur les fichiers dentre principal et de rfrence afin dafficher leur vue Basic settings. Toutes les proprits sont automatiquement renseignes. Si vous ne dfinissez pas vos fichiers dentre dans le Repository, remplissez les champs manuellement, aprs avoir slectionn Built-in dans le champ Property Type. Pour plus dinformations, consultez le Guide Utilisateur Talend Open Studio. Double-cliquez sur le tJoin afin dafficher sa vue Basic settings et dfinir ses proprits. Cliquez sur le bouton situ ct du champ Edit schema pour ouvrir une bote de dialogue qui affiche la structure des donnes des fichiers dentre, et dfinissez les donnes que vous souhaitez passer aux composants de sortie, trois colonnes dans ce scnario, idClient, firstnameClient et lastnameClient.

Cliquez sur OK pour fermer la bote de dialogue. Dans la zone Key definition de longlet Basic settings du composant tJoin, cliquez sur le bouton [+] pour ajouter deux colonnes la liste, puis slectionnez les colonnes dentre et de sortie sur lesquelles la correspondance exacte sera applique, depuis les listes Input key attribute et Lookup key attribute, respectivement firstnameClient et lastnameClient dans cet exemple. Cochez la case Inner join (with reject output) pour dfinir lune des sorties comme table de rejet de linner join. Double-cliquez sur le composant tFileOutputExcel pour afficher longlet Basic settings de sa vue Component, et dfinir ses proprits.

Guide de Rfrence des Composants Talend Open Studio

1515

Scnario : Faire une correspondance exacte entre deux colonnes et crire les donnes rejetes

Paramtrez le rpertoire de destination ainsi que le nom de la feuille (Sheet name) et cochez la case Include header. Double-cliquez sur le composant tFileOutputDelimited pour afficher longlet Basic settings de sa vue Component, et dfinir ses proprits.

Paramtrez le rpertoire de destination ainsi que les sparateurs de lignes (Row separator) et de champs (Field separator) et cochez la case Include header. Sauvgardez votre Job et appuyez sur F6 pour lexcuter.

1516

Guide de Rfrence des Composants Talend Open Studio

Scnario : Faire une correspondance exacte entre deux colonnes et crire les donnes rejetes

La sortie de la correspondance exacte des colonnes firstnameClient et lastnameClient est crite dans le fichier Excel dfini.

Les donnes qui ne correspondent pas sont crites dans le fichier delimit dfini.

Guide de Rfrence des Composants Talend Open Studio

1517

tMap

tMap

Proprits du tMap
Famille de composant Fonction Objectif Basic settings Processing Le tMap est un composant avanc qui sintgre Talend Open Studio comme un plug-in. Le tMap transforme et dirige les donnes partir dune ou plusieurs source(s) et vers une ou plusieurs destination(s). Preview Laperu est un instantan des donnes du Mapper. Il nest visible que lorsque les proprits du Mapper sont renseignes. La synchronisation de laperu ne prend effet quaprs la sauvegarde des modifications.

Mapping links Auto : par dfaut, les liens sont en forme de courbes. display as Curves : les liens du mapping sont en forme de courbes. Lines : les liens du mapping sont en forme de lignes droites. Cette dernire option amliore lgrement les performances. Map editor Le Mapper est lditeur du tMap. Il vous permet de dfinir les proprits daiguillage et de transformation des donnes. Si vous ne souhaitez pas grer les erreurs dexcution, vous pouvez utiliser loption Die on error (coche par dfaut), en haut droite de lditeur. Cette option arrte le Job en cas derreur. Utilisation Plusieurs utilisations sont possibles, de la simple rorganisation des champs de donnes aux transformations les plus complexes, telles que le multiplexage et le dmultiplexage de donnes, la concatnation, linversion, le filtrage, etc. Lutilisation du composant tMap requiert un niveau moyen de connaissances en Java afin dexploiter au mieux ses fonctionnalits. Ce composant est utilis comme une tape intermdiaire, cest pourquoi il ne peut pas tre utilis comme composant de dbut ou de fin de Job. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio.

Limitation

Scnario 1 : Mapping simple de donnes avec filtre et jointure explicite


Le Job Java ci-dessous a pour objectif de lire des donnes dun fichier .csv stock dans le Repository, de rechercher des donnes dun fichier de rfrence, dont le schma est galement stock dans le Repository puis dextraire des donnes de ces deux fichiers en fonction de filtres et denvoyer ces donnes vers les fichiers de sortie et de rejet.

1518

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Mapping simple de donnes avec filtre et jointure explicite

Cliquez sur File dans la Palette de composants, slectionnez tFileInputDelimited et dposez-le dans lespace de modlisation. Changez le libell en Cars (vhicules), soit en double-cliquant sur le libell directement dans lespace de modlisation graphique, soit via longlet View de la vue Component. Rptez cette opration et renommez le second composant dentre en Owners (propritaires). Cliquez sur Processing dans la Palette de composants, slectionnez le tMap et dposez-le dans lespace de modlisation. Reliez les deux composants dentre Owners et Cars au composant tMap et renommez les libells des connexions, Cars_data et Owners_data respectivement. Double-cliquez sur le composant tFileInputDelimited nomm Cars pour paramtrer ses proprits de base (Basic settings).

Slectionnez Repository dans les champs Property type et Schema. Pour le schma, slectionnez la mtadonne cars dans la bote de dialogue [Repository Content]. Le reste des champs est automatiquement renseign lorsque vous slectionnez la mtadonne approprie dans la liste. Double-cliquez sur le composant Owners et dfinissez nouveau les proprits. Slectionnez la mtadonne approprie, owners dans cet exemple. Dans ce scnario, les schmas dentre sont stocks dans le nud Metadata de la vue Repository afin de les retrouver plus facilement. Pour plus dinformations concernant la cration de mtadonnes dans le Repository, consultez le Guide utilisateur de Talend Open Studio. Double-cliquez sur le composant tMap pour ouvrir le Mapper. La zone Input (donnes en entre) est dj renseigne avec les schmas des composants dentre et la premire table correspond au flux principal (Main Row). Les libells de chacune des connexions dentre apparaissent en en-tte des tables. Crez une jointure entre les deux tables dentre en faisant simplement glisser le champ ID_Owner de la table principale (Cars_data) vers le champ quivalent de la table de rfrence (Owners_data).

Guide de Rfrence des Composants Talend Open Studio

1519

Scnario 1 : Mapping simple de donnes avec filtre et jointure explicite

Dfinissez le lien en Inner Join en cliquant sur le bouton tMap settings, en cliquant dans le champ Value pour Join Model, en cliquant sur le bouton qui apparat dans le champ et en slectionnant Inner Join dans la liste Options.

Cliquez sur le signe [+] dans la zone Output (sortie) du Map Editor et ajoutez trois tables de sortie : Insured, Reject_NoInsur, Reject_OwnerID. Glissez et dposez le contenu de la table Cars_data vers la table Insured. Glissez les colonnes ID_Owner, Registration et ID_Reseller de la table Cars_data, ainsi que la colonne Name de la table Owners_data dans la table Reject_NoInsur. Glissez toutes les colonnes de la table Cars_data dans la table Reject_OwnerID. Pour plus dinformations concernant le mapping de donnes, consultez le Guide utilisateur de Talend Open Studio. Cliquez sur le bouton [+] en haut de la table Insured afin dajouter une ligne de filtre. Glissez la colonne ID_Insurance de la table Owners_data vers la zone de filtre et saisissez la formule suivante dexclusion des valeurs non dfinies : Owners_data.ID_Insurance != null. Avec ce filtre, la table Insured va rassemble tous les enregistrements qui possdent un ID Insurance.

1520

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Mapping simple de donnes avec filtre et jointure explicite

Cliquez sur le bouton tMap settings en haut de la table Reject_NoInsur et slectionnez true pour Catch lookup inner join reject afin que de dfinir cette table comme le flux de rejet standard pour rassembler les enregistrements nayant pas dID Insurance.

Cliquez sur le bouton tMap Settings en haut de la table Reject_OwnerID puis slectionnez true pour Catch lookup inner join reject afin que cette table rassemble les enregistrements du flux Cars_data ayant des IDs manquants ou ne correspondant pas.

Cliquez sur OK pour valider et revenir lespace de modlisation. Ajoutez trois composants tFileOutputDelimited dans lespace de modlisation graphique. Reliez le tMap laide ces trois composants de sortie laide des liens Row correspondants. Renommez les trois composants selon les liens.

Guide de Rfrence des Composants Talend Open Studio

1521

Scnario 2 : Mapping de donnes avec rejet Inner join

Double-cliquez sur chacun des composants de sortie afin de dfinir leurs proprits. Si vous souhaitez crer un nouveau fichier, parcourez votre systme jusquau dossier de destination et saisissez le nom du fichier avec son extension. Cochez la case Include header pour rutiliser les libells des colonnes du schma dentre dans comme entte dans votre fichier de sortie.

Sauvegardez votre Job et appuyez sur F6 pour excuter le Job ou passez longlet Run Job et cliquez sur le bouton Run. Les fichiers de sortie sont crs et ils contiennent les donnes dfinies.

Scnario 2 : Mapping de donnes avec rejet Inner join


Ce scnario, bas sur le scnario 1, requiert lajout dun fichier dentre contenant les informations sur les revendeurs, ainsi que lajout de champs supplmentaires dans la table de sortie principale. De plus, deux filtres sont ajouts sur les jointures Inner Join afin de rcuprer les rejets spcifiques.

1522

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Mapping de donnes avec rejet Inner join

Cliquez sur File dans la Palette des composants et dposez un composant tFileInputDelimited dans lespace de modlisation graphique. Renommez-le Resellers. Connectez ce nouveau composant au tMap et ajoutez un libell cette connexion : ici, Resellers_data. Double-cliquez sur le composant Resellers pour dfinir ses proprits dans la vue Basic settings.

Slectionnez Repository dans la liste Property Type et slectionnez le schma resellers, dans la bote de dialogue [Repository Content]. Les autres champs sont automatiquement renseigns. Dans ce scnario, les schmas dentre sont stocks sous le nud Metadata du Repository afin de les retrouver facilement. Pour plus dinformations concernant la cration de mtadonnes dans le Repository, consultez le Guide utilisateur de Talend Open Studio. Double-cliquez sur le composant tMap pour ouvrir le Map Editor. Vous remarquerez que le schma est automatiquement ajout la zone Input des schmas dentre. Crez une jointure entre le flux dentre principal et le nouveau flux dentre en dposant la colonne ID_Reseller de la table Cars_data dans la colonne ID_Reseller de la table Resellers_data. Cliquez sur le bouton tMap settings en haut de la table Resellers_data et slectionnez Inner Join comme modle de jointure (Join Model).

Guide de Rfrence des Composants Talend Open Studio

1523

Scnario 2 : Mapping de donnes avec rejet Inner join

Glissez-dposez toutes les colonnes de la table Resellers_data sauf ID_Reseller dans la table de sortie principale, Insured.

Lorsque deux Inner Joins sont dfinis, vous devez soit dfinir deux tables de rejet inner join pour diffrencier les deux rejets, soit rassembler les deux rejets inner join dans une seule et mme table de sortie, sil ny a quune seule sortie. Dans la zone de sortie Output, cliquez sur le signe [+] pour ajouter une nouvelle table de sortie et nommez-la Reject_ResellerID. Dposez toutes les colonnes de la table Cars_data dans la table Reject_ResellerID.

1524

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Mapping de donnes avec rejet Inner join

Cliquez sur le bouton tMap Settings puis slectionnez true pour Catch lookup inner join reject afin de dfinir la dernire table comme tant la table du flux de sortie de rejets Inner Join. Si la jointure Inner Join ne peut tre tablie pour une entre, les informations concernant les voitures correspondantes seront rassembles dans le flux de sortie.

Appliquez maintenant un filtre sur chacune des sorties de rejet Inner Join afin de distinguer les deux types de rejets. Dans la premire table de rejet (Reject_OwnerID), cliquez sur la flche dote dun signe [+] pour ajouter une ligne de filtre et renseignez ce champ avec la formule suivante pour ne recueillir que les rejets lis au champ OwnerID non dfini : Owners_data.ID_Owner==null Dans la seconde table de rejet Inner Join (Reject_ResellerID), renouvelez lopration et utilisez la formule suivante : Resellers_data.ID_Reseller==null

Guide de Rfrence des Composants Talend Open Studio

1525

Scnario 3 : Mapping de jointure en cascade

Cliquez sur Apply pour enregistrer les changements, puis sur OK pour fermer le Mapper. Dposez un nouveau composant tFileOutputDelimited de la Palette dans lespace de modlisation graphique et nommez-le No_Reseller_ID. Configurez ses proprits. Dans ce scnario, spcifiez simplement le chemin daccs au fichier de sortie et cochez la case Include Header. Laissez les autres paramtres tels quils sont.

Connectez le tMap au nouveau tFileOutputDelimited laide du lien Row nomm Reject_ResellerID. Pour comprendre le fonctionnement du Mapper, dans ce scnario, retirez du fichier Resellers.csv les lignes correspondant aux Reseller ID 5 et 8. Excutez le Job via la touche F6 du clavier, ou partir de la vue Run. Les quatre fichiers de sortie sont tous crs dans le dossier dfini dans les proprits de la vue Component. Remarquez que dans le fichier de rejet li lInner Join, NoResellerID.csv, le champ ID_Owners correspond aux entres du fichier Cars dont le Reseller ID est gal 5 et 8, manquant dans le fichier Resellers.csv.

Scnario 3 : Mapping de jointure en cascade


Un troisime scnario plus avanc et bas sur le scnario 2 requiert lajout dune nouvelle entre contenant les informations dassurance, par exemple. Dans le Mapper, mettez en place une jointure Inner Join entre deux tables de rfrence (Lookup) des flux secondaires Owners et Insurance afin de grer les rfrences en cascade et par consquent de rcuprer les informations de la table Insurance via les donnes de la table Owners.

1526

Guide de Rfrence des Composants Talend Open Studio

Scnario 4 : Mapping avanc avec filtres, jointures explicites et rejet Inner join

Scnario 4 : Mapping avanc avec filtres, jointures explicites et rejet Inner join
Ce scnario prsente un Job utilisant le tMap et permettant de trouver les clients propritaires dune voiture de marque dfinie et avoir entre 2 et 6 enfants (inclus) dans un but de vente incitative.

Cliquez-dposez les composants suivants de la Palette dans lespace de modlisation graphique : tFileInputDelimited (x3), tMap, tFileOutputDelimited (x2) Connectez les composants dentre au tMap laide de connexions de type Main row. Faites attention au premier composant que vous connectez car son flux de donnes sera automatiquement un flux Main (principal). Et toutes les autres connexions seront alors de type Lookup (flux de rfrence). Dans ce scnario, le composant dentre Owners sera reli au tMap par le flux Main. Dfinissez les proprits de chaque composant dentre dans longlet Basic settings. Configurez les proprits du composant Owners.

Slectionnez Repository dans la liste Property Type et slectionnez le schma resellers, dans la bote de dialogue [Repository Content]. Les autres champs sont automatiquement renseigns. Dans ce scnario, les schmas dentre sont stocks sous le nud Metadata du Repository afin de les retrouver facilement. Pour plus dinformations concernant la cration de mtadonnes dans le Repository, consultez le Guide utilisateur de Talend Open Studio. Rptez ces tapes pour les autres composants dentre : Cars et Resellers. Ces deux flux de rfrence (Lookup) renseigneront les tables secondaires (lookup) de la zone dentre du Map Editor. Double-cliquez sur le composant tMap pour ouvrir le Map Editor et dfinir le mapping et les filtres. Configurez une jointure explicite entre le flux Main Owner et le flux Lookup Cars en glissant-dposant la colonne ID_Owner de la table Owner dans la colonne ID_Owner de la table Cars. La jointure explicite saffiche avec une cl de hachage.

Guide de Rfrence des Composants Talend Open Studio

1527

Scnario 4 : Mapping avanc avec filtres, jointures explicites et rejet Inner join

Dans le champ Expr. Key de la colonne Make (Marque), saisissez (en Java) le filtre appliquer. Dans ce cas dutilisation, saisissez simplement BMW puisque ce qui est recherch ce sont les propritaires (Owners) de cette marque en particulier.

Effectuez une jointure en cascade entre les deux tables de rfrence Cars et Resellers, sur la colonne ID_Reseller, afin de retrouver les informations sur les propritaires et plus prcisment le nombre denfants quils ont. Comme vous souhaitez exclure les valeurs nulles dans une table spare et les exclure de la sortie standard, cliquez sur le bouton tMap Settings puis slectionnez Inner Join comme modle de jointure pour chaque table Lookup filtrer.

1528

Guide de Rfrence des Composants Talend Open Studio

Scnario 4 : Mapping avanc avec filtres, jointures explicites et rejet Inner join

Dans les paramtres du tMap, vous pouvez slectionner une des options suivantes : Unique match, First match, ou All Matches. Dans cet exemple, slectionnez loption All matches. Ainsi, si plusieurs correspondances sont trouves dans lInner Join (i.e. les lignes rpondant la jointure explicite ainsi quau filtre), elles seront toutes prises en compte dans le flux de sortie (soit dans le flux de rejet, soit dans le flux de sortie standard). Loption Unique match fonctionne de la mme manire que loption Last match. Les options First match et All matches fonctionnent comme lindiquent leurs noms (respectivement premire correspondance et toutes les correspondances). Puis dans la zone Output du Map Editor, ajoutez deux tables : une pour les correspondances rpondant la jointure explicite et au filtre et une pour les rejets. Dposez toutes les colonnes de la table Owners, les colonnes Registration, Make et Color de la table Cars ainsi que les colonnes ID_Reseller et Name_Reseller de la table Reseller dans la table de sortie principale. Dposez toutes les colonnes de la table Owners dans la table de rejets. Cliquez sur le bouton Filter en haut de la table de sortie principale afin dafficher la zone dexpression Filter. Saisissez une instruction afin de rduire le nombre de lignes charges dans le flux principale de sortie. Dans cet exemple, saisissez : Owners.Children_Nr >=2 && Owners.Children_Nr <= 6. Dans la table de rejets, cliquez sur le bouton tMap settings et dfinissez les types de rejets. Slectionnez true pour Catch output reject afin de collecter des donnes concernant les dtenteurs de voitures BMW ayant moins de deux enfants ou plus de six enfants. Slectionnez true pour Catch lookup inner join reject afin de collecter des donnes concernant les propritaires dautres marques et ceux pour qui linformation Reseller est introuvable.

Guide de Rfrence des Composants Talend Open Studio

1529

Scnario 4 : Mapping avanc avec filtres, jointures explicites et rejet Inner join

Cliquez sur OK pour valider le mapping et fermer lditeur. Dans lditeur graphique, cliquez droit sur le tMap et crez une connexion de sortie vers les composants correspondants. Dfinissez les paramtres des composants de sortie dans longlet Basic settings. Dans ce scnario, spcifiez simplement les chemins daccs aux fichiers de sortie et cochez la case Include Header. Laissez les autres paramtres tels quils sont.

Enregistrez votre Job, puis appuyez sur F6 pour lexcuter.

1530

Guide de Rfrence des Composants Talend Open Studio

Scnario 5 : Mapping avanc avec filtres et diffrents rejets

Le fichier de sortie principal contient les informations concernant les dtenteurs de BMW ayant entre deux et six enfants, et le fichier de rejet contient les informations concernant les autres possesseurs de voiture(s).

Scnario 5 : Mapping avanc avec filtres et diffrents rejets


Ce scnario est une version modifie du scnario prcdent. Il dcrit un Job qui applique des filtres pour limiter la recherche aux possesseurs de voitures BMW ou Mercedes ayant entre deux et six enfants et divise les donnes sans correspondance en diffrents flux de rejets.

Reprenez le Job de la section intitule Scnario 4 : Mapping avanc avec filtres, jointures explicites et rejet Inner join . Dposez un nouveau tFileOutputDelimited de la Palette dans lespace de modlisation graphique et nommez-le Rejects_BMW_Mercedes. Connectez le composant tMap au nouveau composant de sortie laide dune connexion Row et nommez cette connexion selon la fonction du composant de sortie. Ce lien deviendra le nom de la nouvelle table de sortie dans le Map Editor. Renommez les connexions et les composants de sortie existants afin de prsenter leur fonction.

Guide de Rfrence des Composants Talend Open Studio

1531

Scnario 5 : Mapping avanc avec filtres et diffrents rejets

Les tables de sortie dans le Map Editor seront automatiquement renommes selon le libell des liens. Dans cet exemple, renommez les connexions de sortie BMW_Mercedes_withChildren et Owners_Other_Makes, respectivement. Double-cliquez sur le composant tMap afin de lancer le Map Editor pour modifier le mapping et les filtres. Remarquez que la zone de sortie contient une nouvelle table de sortie, vide, nomme Rejects BMW_Mercedes. Vous pouvez ajuster la position de la table en la slectionnant et en cliquant sur les flches pointant vers le haut ou vers le bas, en haut de la zone de sortie. Supprimez le filtre BMW de la table Cars dans la zone dentre. Cliquez sur le bouton Filters pour afficher le champ Filter et saisissez un nouveau filtre afin de limiter la recherche aux seules marques de voitures BMW et Mercedes. Linstruction est la suivante : Cars.Make.equals(BMW) || Cars.Make.equals(Mercedes).

Slectionnez toutes les colonnes de la table principale de sortie et dposez-les dans la nouvelle table de sortie. Sinon, vous pouvez glisser les colonnes des tables dentre correspondantes dans la nouvelle table de sortie. Cliquez sur le bouton tMap settings en haut de la nouvelle table de sortie et slectionnez true pour Catch output reject afin de collecter les donnes concernant les dtenteurs de voiture(s) BMW ou Mercedes ayant moins de deux enfants ou plus de six. Dans la table Owners_Other_Makes, slectionnez true pour Catch lookup inner join reject afin de collecter les donnes concernant les possesseurs de voitures dautres marques et ceux dont linformation reseller est introuvable.

1532

Guide de Rfrence des Composants Talend Open Studio

Scnario 5 : Mapping avanc avec filtres et diffrents rejets

Cliquez sur OK pour valider le mapping et fermer le Map Editor. Configurez les proprits des composants de sortie dans leur vue Basic settings respective. Dans ce scnario, dfinissez simplement les nouveaux chemins daccs aux fichiers de sortie et cochez la case Include Header.

Guide de Rfrence des Composants Talend Open Studio

1533

Scnario 6 : Mapping avanc avec rechargement de la base de rfrence chaque ligne

Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Le contenu du flux de sortie principal montre que les lignes filtres sont bien passes.

Scnario 6 : Mapping avanc avec rechargement de la base de rfrence chaque ligne


Le scnario suivant dcrit un Job permettant de rcuprer certaines informations sur des personnes dans une base de donnes de rfrence, en se basant sur une jointure effectue sur leur ge. Le flux principal des donnes source est lu partir dune table MySQL appele people_age contenant certains dtails sur les personnes, comme leur identifiant (numrique), leur nom et prnom (alphanumrique) ainsi que leur ge (numrique), qui peut tre soit 40, soit 60 ans. On a intentionnellement rduit le nombre dentres de cette table. Les informations de rfrence sont galement stockes dans une table MySQL appele large_data_volume. Cette table de rfrence contient un certain nombre dentres, dont le nom des villes dans lesquelles les personnes enregistres dans la table principale sont alles. Le nombre dentres a t restreint pour plus de clart mais, dans le cas dune utilisation normale, le Job ci-dessous a des rsultats plus significatifs quand on traite un gros volume de donnes de rfrence. Pour optimiser les performances, un composant de connexion aux bases de donnes est utilis au dbut de ce Job pour ouvrir une connexion la base de donnes de rfrence afin de ne pas ouvrir et refermer une connexion chaque ligne de la table de rfrence charge.

1534

Guide de Rfrence des Composants Talend Open Studio

Scnario 6 : Mapping avanc avec rechargement de la base de rfrence chaque ligne

Un filtre dexpression (expression filter) est appliqu ce flux de rfrence, qui permet de ne slectionner que les donnes des personnes dont lge est 60 ou 40 ans. Ainsi, seules les lignes pertinentes de la table de rfrence sont enregistres pour chaque ligne du flux principal. Ce Job prsente donc comment, partir dun nombre limit de lignes de flux principal, on peut optimiser la base de donnes de rfrence pour nenregistrer que les rsultats correspondant la cl dexpression (expression key). En gnral, comme le chargement des rfrences seffectue pour chacune des lignes de flux principal, il est plus intressant dutiliser cette option quand on ne traite quun nombre limit de lignes de flux principal et un grand nombre de lignes de rfrence. La jointure seffectue au niveau du champ age. Les informations de la base de rfrence sont ensuite charges pour chacune des lignes du flux principal en entre, en utilisant loption de chargement approprie dans lditeur du composant tMap.

Dans cet exemple, les mtadonnes ont t prpares pour le composant de connexion et les composants source. Pour plus dinformations sur les mtadonnes de connexion aux bases de donnes et les mtadonnes de cration de schmas des tables, consultez la section ddie au sujet dans le Guide Utilisateur de Talend Open Studio. Le Job est form de cinq composants, quatre composants de bases de donnes et un composant de mapping. A partir du nud Metadata > Db Connections dans le Repository, glissez le schma de base de donnes dans lditeur graphique. Dans cet exemple, la table source sappelle people_age. Lorsque vous dposez le composant, une liste apparat lcran : slectionnez le composant tMysqlInput.

Guide de Rfrence des Composants Talend Open Studio

1535

Scnario 6 : Mapping avanc avec rechargement de la base de rfrence chaque ligne

Dposez le schma de base de donne de rfrence partir du nud Metadata > Db Connections. Dans cet exemple, la table de rfrence sappelle large_data_volume. De la mme manire, glissez une connexion la base de donnes du nud Db Connections dans le Repository dans lditeur graphique. Dans la bote de dialogue [Components], slectionnez le composant tMysqlConnection. Ce composant cre une connexion permanente la base de donnes de rfrence afin dviter que la connexion ne se referme au chargement que chaque ligne de rfrence. A partir de la Palette, dposez dans lditeur graphique le composant tMap (famille Processing) et les composants tMysqlCommit et tMysqlOutput (famille Database). Reliez maintenant tous les composants entre eux : faites un clic-droit sur le tMysqlInput correspondant la table people et maintenez le bouton enfonc tout en dplaant le curseur jusquau tMap. Relchez le bouton lorsque vous tes sur le tMap, le flux principal de lignes est cr automatiquement. Renommez le lien de type Main en people, pour pouvoir identifier plus facilement le flux de donnes principal. Effectuez la mme opration pour connecter la table de rfrence (large_data_volume) au tMap et le tMap au tMysqlOutput. Une bote de dialogue apparat et vous devez donner un nom au lien de sortie. Dans cet exemple, le flux de sortie sappelle people_mixandmatch. Renommez galement le lien de connexion la base de rfrence en large_volume pour pouvoir identifier plus facilement le flux de donnes. Connectez le tMysqlConnection au tMysqlInput via un lien de type OnSubjobOk. Double-cliquez ensuite sur le composant tMap pour ouvrir lditeur graphique de mapping.

1536

Guide de Rfrence des Composants Talend Open Studio

Scnario 6 : Mapping avanc avec rechargement de la base de rfrence chaque ligne

La table Output (qui sest cre automatiquement quand vous avez li le tMap au tMysqlOutput) sera compose des lignes concordantes du flux de rfrence (large_data_volume) et du flux principal (people_age). Slectionnez les lignes du flux principal que vous voulez passer en sortie et faites les glisser vers la table de sortie (dans le coin suprieur droit de lditeur de mapping) : ils y seront copis. Dans cet exemple, la slection des lignes du flux principal inclut les champs suivants : id, first_name, last_Name et age. Dans la table de rfrence, la colonne city est slectionne. Faites glisser les colonnes slectionnes des tables dentre (people et large_volume) vers la table de sortie. Crez maintenant la jointure entre le flux principal et le flux de rfrence. Slectionnez la colonne age dans la table du flux principal (en haut) et faites-la glisser vers la colonne age de la table du flux de rfrence (large_volume dans cet exemple). Licne dune cl apparat ct de lexpression lie dans la table de rfrence. La jointure est maintenant tablie. Cliquez sur le bouton tMap Settings puis sur le bouton [...] correspondant Lookup Model et slectionnez loption Reload at each row dans la bote de dialogue [Options] pour que la base de rfrence soit charge nouveau pour chaque nouvelle ligne traite.

Guide de Rfrence des Composants Talend Open Studio

1537

Scnario 6 : Mapping avanc avec rechargement de la base de rfrence chaque ligne

De la mme manire, paramtrez Match Model comme All matches dans la table de rfrence pour rcuprer dans le flux de sortie toutes les occurrences de age qui correspondent. Implmentez ensuite le filtre, tabli partir de la colonne age, dans la table de rfrence. Le champ GlobalMapKey est cr automatiquement lorsque vous slectionnez loption Reload at each row. Vous pouvez donc utiliser cette expression pour filtrer les donnes de rfrence de manire dynamique, pour que seules les informations pertinentes soient charges avec le flux principal. Comme la soulign lintroduction de ce scnario, le flux de donnes principal contient uniquement les personnes dont lge vaut 40 ou 60. Pour viter de charger toutes les lignes de la table de rfrence, dont les ges sont diffrents de 40 et 60, vous pouvez utiliser la valeur ge du flux principal comme variable globale pour alimenter le filtre de rfrence.

1538

Guide de Rfrence des Composants Talend Open Studio

Scnario 6 : Mapping avanc avec rechargement de la base de rfrence chaque ligne

Glissez la colonne Age de la table de flux principal vers le champ Expr. dans la table de rfrence. Renseignez ensuite le nom de la variable dans le champ globalMap Key, en utilisant une expression. Dans cet exemple, lexpression est : people.Age. Cliquez sur le bouton OK pour enregistrer les paramtres de mapping et retourner dans lditeur graphique. Pour terminer limplmentation du filtrage dynamique du flux de rfrence, vous devez maintenant ajouter une clause WHERE la requte de la base de donnes dentre.

A la fin du champ Query, juste aprs la commande Select, entrez la clause de type WHERE suivante : WHERE AGE ='"+((Integer)globalMap.get("people.Age"))+"'". Assurez-vous que le type correspond la colonne utilise comme variable. Dans cet exemple, la donne Age est du type Integer. Veillez aussi utiliser la variable de la manire dont vous lavez paramtre dans le champ globalMap key de lditeur de mapping. Double-cliquez ensuite sur le composant tMysqlOutput et vrifiez que le schma correspond aux paramtres de mapping.

Cochez la case Use an existing connection afin dutiliser la connexion cre. Spcifiez dans le champ Table le nom de la table cible. Dans les listes Action on table et Action on data, slectionnez les actions que vous souhaitez effectuer. Cliquez sur longlet Run au bas de lespace de modlisation graphique, afin dafficher longlet dexcution. Dans la vue Debug Run, cliquez sur le bouton Traces Debug pour voir la progression du traitement des donnes. Pour une meilleure visibilit, il est possible dagrandir la vue du Job dans lditeur graphique lors de lexcution en double-cliquant simplement sur longlet portant le nom du Job.

Guide de Rfrence des Composants Talend Open Studio

1539

Scnario 7 : Mapping avec des tables de sortie

Les donnes de rfrence sont charges nouveau pour chaque ligne du flux principal qui correspond la contrainte dge. Toutes les correspondances la condition age sont rcupres partir des lignes de la table de rfrence et regroupes dans le flux de sortie. Si vous vrifiez les donnes contenues dans la table people_mixandmatch nouvellement cre, vous y trouverez toutes les copies bases sur age correspondant aux diffrentes personnes dont lge vaut 40 ou 60, ainsi que les villes o ils sont alls.

Scnario 7 : Mapping avec des tables de sortie


Le scnario suivant dcrit un Job traitant des flux de rejet sans les sparer du flux principal.

1540

Guide de Rfrence des Composants Talend Open Studio

Scnario 7 : Mapping avec des tables de sortie

Dans la vue Repository, cliquez sur Metadata > File delimited. Glissez-dposez la mtadonne customers dans lespace de modlisation graphique. La mtadonne customers contient des informations relatives aux clients, comme leur ID, leur nom, leur adresse, etc. Pour plus dinformations concernant la centralisation des mtadonnes, consultez le Guide Utilisateur de Talend Open Studio. Une bote de dialogue souvre et vous demande de choisir le type de composant que vous souhaitez utiliser. Slectionnez le composant tFileInputDelimited et cliquez sur OK. Ensuite, glissez-dposez la mtadonne states. Slectionnez le mme composant dans la bote de dialogue et cliquez sur OK. La mtadonne states contient lidentifiant de ltat, ainsi que son nom. Glissez-dposez de la Palette dans lespace de modlisation graphique un tMap et deux composants tLogRow. Reliez le composant customers au tMap laide dun lien Row > Main. Reliez le composant states au tMap, en utilisant un lien Row > Main. Il sera automatiquement dfini comme Lookup. Double-cliquez sur le composant tMap afin douvrir le Map Editor. Glissez-dposez la colonne idState dans la premire ligne de la seconde table, afin de crer une jointure. Cliquez sur le bouton tMap settings et slectionnez Inner Join pour Join Model. Cliquez sur le bouton Property settings en haut de la zone dentre afin douvrir la bote de dialogue [Property settings] et dcochez la case Die on error si vous souhaitez grer les erreurs dexcution. La table ErrorReject est maintenant cre.

Guide de Rfrence des Composants Talend Open Studio

1541

Scnario 7 : Mapping avec des tables de sortie

Slectionnez les colonnes id, idState, RegTime et RegisterTime de la table dentre et dposez-les dans la table ErrorReject.

Cliquez sur le bouton [+] en haut droite de lditeur afin dajouter une table de sortie. Dans la bote de dialogue qui souvre, slectionnez New output. Dans le champ ct, saisissez le nom de la table, out1. Cliquez sur OK. Dposez les colonnes suivantes des tables dentre dans la table out1 : id, CustomerName, idState et LabelState. Ajoutez deux colonnes RegTime et RegisterTime la fin de la colonne out1 et paramtrez leur format de date : dd/MM/yyyy HH:mm et yyyy-MM-dd HH:mm:ss.SSS, respectivement. Cliquez sur le champ Expression pour RegTime et appuyez sur Ctrl+Espace pour afficher la liste dautocompltion. Slectionnez TalendDate.parseDate. Changez le modle en ("dd/MM/yyyy HH:mm",row1.RegTime). Rptez lopration pour la seconde colonne, mais changez le modle en ("yyyy-MM-dd HH:mm:ss.SSS",row1.RegisterTime).

1542

Guide de Rfrence des Composants Talend Open Studio

Scnario 7 : Mapping avec des tables de sortie

Cliquez sur le bouton [+] en haut droite de lditeur, afin dajouter une table de sortie. Dans la bote de dialogue qui souvre, slectionnez Create join table from, choisissez Out1 et donnez le nom rejectInner. Cliquez sur OK. Cliquez sur le bouton tMap settings et slectionnez true pour Catch lookup inner join reject, afin de grer les rejets. Dposez les colonnes id, CustomerName et idState des tables dentre dans les colonnes correspondantes de la table rejectInner. Cliquez dans le champ Expression de la colonne LabelState et saisissez UNKNOWN. Cliquez dans le champ Expression de la colonne RegTime, appuyez sur Ctrl+Espace, et slectionnez TalendDate.parseDate. Changez le modle en ("dd/MM/yyyy HH:mm",row1.RegTime.) Dans la colonne RegisterTime, appuyez sur Ctrl+Espace, et slectionnez TalendDate.parseDate, mais changez le modle en ("yyyy-MM-dd HH:mm:ss.SSS",row1.RegisterTime). Si les donnes de la ligne row1 ont un modle incorrect, elles seront retournes par le flux ErrorReject.

Guide de Rfrence des Composants Talend Open Studio

1543

Scnario 7 : Mapping avec des tables de sortie

Cliquez sur OK afin de valider les modifications et fermer lditeur. Double-cliquez sur le composant tLogRow afin dafficher sa vue Component. Cliquez sur Sync columns pour rcuprer la structure du schma depuis le mapper si ncessaire. Dans la zone Mode, slectionnez Table. Rptez lopration avec le second tLogRow. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. La console de la vue Run affiche les flux de sortie principal et le flux ErrorReject. Le flux de sortie principal unifie les donnes valides et les rejets Inner Join, alors que le flux ErrorReject contient les informations des erreurs concernant les lignes ayant un format de date non analysable

1544

Guide de Rfrence des Composants Talend Open Studio

tNormalize

tNormalize

Proprits du tNormalize
Famille de composant Fonction Objectif Basic settings Processing/Fields Le composant tNormalize normalise un flux entrant en fonction du standard SQL. Le tNormalize permet damliorer la qualit de donnes et donc facilite la mise jour des donnes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Pour ce composant, le schma est en lecture seule. Built-in : Le schma est cr et conserv pour ce composant uniquement. Voir galement le Guide utilisateur de Talend Open Studio. Column to normalize Item separator Advanced settings Slectionnez la colonne du flux entrant sur laquelle est base la normalisation. Renseignez le sparateur dlimitant les donnes du flux entrant.

Get rid of duplicated Cochez cette case pour supprimer les lignes doublons du rows from output flux de sortie. Use CSV parameters Cochez cette case pour prendre en compte les paramtres spcifiques aux fichiers CSV, notamment la manire de protger les caractres dans le champ escape mode et le type de guillemet dans le champ enclosure. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation Limitation

Ce composant est gnralement utilis comme composant intermdiaire dans un flux de donnes. n/a

Scnario : Normaliser des donnes


Ce scnario illustre un Job qui normalise une liste de mots-cls des sujets dun forum puis les transmet sous forme de tableau dans la console de la vue Run.

Cliquez et dposez les composants suivants dans lespace de modlisation : tFileInputDelimited, tNormalize, tLogRow.

Guide de Rfrence des Composants Talend Open Studio

1545

Scnario : Normaliser des donnes

Dans longlet Basic settings du composant tFileInputDelimited, slectionnez le fichier normaliser.

Le schma du fichier est stock dans le Repository. Il est compos dune colonne, appele Tags, et chaque ligne possde un ou plusieurs mots-cls. Dans les champs Row Separator et Field Separator, renseignez les sparateurs de lignes et de champs.

Dans longlet Basic settings du composant tNormalize, dans la liste Column to normalize, slectionnez la colonne sur laquelle la normalisation est base. Dans ce scnario, la colonne normaliser est Tags.

Dans le champ Item separator, renseignez le sparateur de donnes, ici la virgule, que vous devez saisir entre guillemets. Dans les proprits du composant tLogRow, slectionnez le mode Table (print values in the cells of table). Enregistrez le Job et excutez-le, en appuyant sur F6.

1546

Guide de Rfrence des Composants Talend Open Studio

Scnario : Normaliser des donnes

Les valeurs sont normalises et affiches dans un tableau dans la console.

Guide de Rfrence des Composants Talend Open Studio

1547

tReplace

tReplace

Proprits du tReplace
Famille de composant Fonction Objectif Basic settings Processing Le composant tReplace effectue un Rechercher/Remplacer dans les colonnes dentre spcifies. Ce composant permet de nettoyer tous les fichiers avant traitement. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Deux colonnes en lecture seule sont automatiquement ajoutes au schma de sortie : Value et Match. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide Utilisateur de Talend Open Studio. Simple Mode Search / Cliquez sur le bouton [+] pour ajouter autant de condiReplace tions que vous le souhaitez. Les conditions sont excutes lune aprs lautre pour chaque ligne. Input column : Slectionnez la colonne du schma sur laquelle effectuer le Rechercher/Remplacer. Search : Saisissez la valeur chercher dans la colonne dentre. Replace with : Saisissez la valeur de remplacement. Whole word : Cochez cette case si la valeur recherche constitue un mot entier. Case sensitive : Cochez cette case pour tenir compte de la casse. Notez que vous ne pouvez pas utiliser dexpression rgulire dans ces colonnes. Advanced settings Utilisation Use advanced mode Cochez cette case si vous souhaitez utiliser des expressions rgulires.

Ce composant nest pas un composant de dbut puisquil requiert un flux de donnes. Il requiert aussi un composant de sortie.

1548

Guide de Rfrence des Composants Talend Open Studio

Scnario : Remplacement mutliple et filtrage de colonnes

Scnario : Remplacement mutliple et filtrage de colonnes


Le Job suivant recherche et remplace diffrentes coquilles et fautes dans un fichier .CSV puis filtre une colonne avant de gnrer en sortie un nouveau fichier .CSV contenant les donnes modifies.

Cliquez et dposez les composants suivants dans lespace de modlisation : tFileInputDelimited, tReplace, tFilterColumn et tFileOutputDelimited. Connectez les composants laide de liens de type Main Row via un clic-droit sur chaque composant. Slectionnez le composant tFileInputDelimited et paramtrez les proprits du flux dentre.

Dans la liste droulante Property type, slectionnez loption Built-in. Puis renseignez manuellement les champs suivants. Si les proprits sont centralises dans le Repository, choisissez loption Repository et les champs seront automatiquement remplis. Le Fichier est un simple fichier .csv stock localement. Ainsi, dans le champ Filepath, renseignez l chemin daccs au fichier. Dans le champ Row Separator, renseignez le sparateur de lignes, ici le retour chariot. Dans le champ Field Separator, renseignez le sparateur de champs, ici un point virgule. Dans cet exemple, l'en tte (Header) est le nom des colonnes, et il n'y a ni pied de page (Footer) ni de nombre limite de lignes traiter (Limit). Le fichier contient des caractres tels que : *t,$,. ou encore Nikson que l'on veut changer en Nixon, et streat, que l'on veut changer en Street.

Dans le champ Schema, slectionnez aussi loption Built-in. Le schma est compos de quatre colonnes de diffrents types : chanes de caractres (string) ou de nombres dcimaux (float).

Guide de Rfrence des Composants Talend Open Studio

1549

Scnario : Remplacement mutliple et filtrage de colonnes

Slectionnez le composant tReplace pour paramtrer les proprits des Rechercher/Remplacer.

Le schma peut tre synchronis partir du flux dentre. Cochez la case Simple mode car les paramtres de recherche peuvent tre facilement dfinis sans avoir recours aux expressions rgulires. Cliquez sur le signe [+] pour ajouter des lignes aux tableaux des paramtres. En premier paramtre, slectionnez amount dans la colonne Input column. Dans la colonne Search, cherchez tous les points et dans la colonne Replace indiquez la valeur de remplacement, ici la virgule. Les valeurs doivent tre mises entre guillemets. En deuxime paramtre, slectionnez Street dans la colonne Input column. Dans la colonne Search, cherchez la chane de caractres streat. Dans la colonne Replace, renseignez la valeur de remplacement, ici Street. En troisime paramtre, slectionnez nouveau Amount dans la colonne Input column, saisissez $ dans la colonne Search et dans la colonne Replace. En quatrime paramtre, slectionnez Name dans la colonne Input column. Dans le champ Search, saissisez Nikson dans la colonne Search et Nixon dans la colonne Replace. En cinquime paramtre, slectionnez Firstname dans la colonne Input column. Dans le champ Search, saisissez la chane de caractre *t, et ne mettez rien entre guillemets. Loption Advanced mode nest pas utilise pour ce scnario. Slectionnez le composant suivant : tFilterColumn.

Le composant tFilterColumn contient un diteur de schma permettant de crer un schma de sortie bas sur le nom des colonnes du schma dentre. Dans cet exemple, ajoutez une nouvelle colonne empty_field et changez lordre des colonnes pour obtenir le schma suivant : empty_field, Firstname, Name, Street, Amount.

1550

Guide de Rfrence des Composants Talend Open Studio

Scnario : Remplacement mutliple et filtrage de colonnes

Cliquez sur OK pour valider. Double-cliquez sur le tFileOutputDelimited afin dafficher sa vue Component.

Dans le champ Property Type, slectionnez loption Built-in et paramtrez les proprits du composant tFileOutputDelimited manuellement. Dans le champ Schema, slectionnez loption Built-in et cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Enregistrez le Job et excutez-le.

La premire colonne est vide, les caractres parasites ont t supprims des autres colonnes, et Nikson a t remplac par Nixon. La colonne Street a t dplace, les dcimales sont dornavant spares par une virgule et le symbole montaire a t chang.

Guide de Rfrence des Composants Talend Open Studio

1551

tSampleRow

tSampleRow

Proprits du tSampleRow
Famille du composant Fonction Objectif Basic settings Processing Le composant tSampleRow filtre les lignes en fonction de leur position. Le tSampleRow permet de slectionner des lignes en fonction dune liste de lignes simples et/ou de groupes de lignes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement leGuide Utilisateur de Talend Open Studio. Range Renseignez la position ou lintervalle choisi, en utilisant la syntaxe approprie, pour rcuprer une liste de lignes simples et/ou de groupes de lignes.

Utilisation Limitation

Ce composant traite des flux de donnes, il ncessite donc des composants dentre et sortie. n/a

Scnario : Filtrer des lignes et des groupes de lignes


Ce scnario Java dcrit un Job trois composants. On utilise un composant tRowGenerator pour crer des entres au hasard qui sont directement envoyes au tSampleRow, o elles seront filtres en fonction de leur position. Dans ce scnario, on suppose que le flux dentre contient les noms des vendeurs associs au nombre de produits quils ont chacun vendus ainsi que le nombre dannes passes dans lentreprise. Le rsultat de lopration de filtrage apparat dans la console Run. A partir de la Palette, cliquez dposez les composants suivants dans lditeur graphique : le tRowGenerator, le tSampleRow et le tLogRow. Connectez ces trois composants laide de liens de type Row > Main.

1552

Guide de Rfrence des Composants Talend Open Studio

Scnario : Filtrer des lignes et des groupes de lignes

Dans lditeur graphique, slectionnez le tRowGenerator. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tRowGenerator. Dans la vue Basic settings, dfinissez loption Schema en mode Built-In puis cliquez sur le bouton [...] ct du champ Edit Schema pour dfinir les donnes que vous voulez utiliser en entre. Dans ce scnario, le schma est compos de cinq colonnes.

Dans longlet Basic settings, cliquez sur RowGenerator Editor pour dfinir les donnes gnrer. Dans lditeur RowGenerator Editor, prcisez le nombre de lignes gnrer dans le champ Number of Rows for RowGenerator puis cliquez sur OK pour fermer lditeur.

Dans lditeur graphique, slectionnez le tSampleRow. Cliquez sur la vue Component pour dfinir la configuration de base (Basic settings) du tSampleRow.

Guide de Rfrence des Composants Talend Open Studio

1553

Scnario : Filtrer des lignes et des groupes de lignes

Dans longlet Basic settings, dfinissez loption Schema en mode Built-In puis cliquez sur Sync columns pour rcuprer le schma partir du composant tRowGenerator. Dans la bote de texte Range, dfinissez le filtre de slection des lignes en utilisant la syntaxe approprie comme indiqu plus haut. Dans ce scnario, on veut slectionner la premire et la cinquime ligne, ainsi que le groupe de lignes entre 9 et 12. Dans lespace graphique, slectionnez le tLogRow puis cliquez sur la vue Component pour en dfinir la configuration de base (Basic settings). Pour plus dinformations sur les proprits du tLogRow, consultez la section intitule tLogRow . Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Les rsultats filtrs apparaissent dans la console de log. Ils affichent la premire et la cinquime ligne, ainsi que les lignes entre 9 et 12.

1554

Guide de Rfrence des Composants Talend Open Studio

tSortRow

tSortRow

Proprits du tSortRow
Famille de composant Fonction Objectif Basic settings Processing Ce composant trie les donnes dentre bases sur une ou plusieurs colonnes, selon un type de tri et un ordre. Il permet dtablir des mtriques et des tables de classification. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma dans cette vue, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent dans le Job. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide Utilisateur de Talend Open Studio. Criteria Cliquez sur [+] pour ajouter autant de lignes que ncessaire pour mettre en place le tri. La premire colonne dfinie dans le schma est slectionne par dfaut. Schema column : Slectionnez la colonne de votre schma sur laquelle vous souhaitez baser votre tri. Notez que lordre est important car il dtermine la priorit de tri. Sort type : Numrique ou Alphabtique. Order : Ordre ascendant ou descendant. Advanced settings Sort on disk Personnalisez la mmoire utilise de manire temporaire pour stocker les donnes de sortie. Temp data directory path : Dfinissez le chemin daccs au dossier dans lequel stocker les fichiers temporaires. Create temp data directory if not exists : Cochez cette case afin de crer le dossier sil nexiste pas. Buffer size of external sort : Entrez la taille de la mmoire physique allouer au processus de tri. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Guide de Rfrence des Composants Talend Open Studio

1555

Scnario : Trier des donnes

Utilisation

Ce composant manipule le flux de donnes et par consquent requiert un composant en entre et un composant en sortie. Il sagit donc dun composant intermdiaire. n/a

Limitation

Scnario : Trier des donnes


Le scnario suivant dcrit un Job constitu de trois composants. Un composant tRowGenerator est utilis pour crer des entres de faon alatoire. Ces entres seront ensuite envoyes au composant tSortRow afin dtre tries selon une valeur dfinie. Dans ce scnario, le flux dentre contient des noms de vendeurs ainsi que leur volume de vente respectif et leur nombre dannes danciennet dans lentreprise. Le rsultat de lopration de tri est affich dans la console Run.

Cliquez et dposez les trois composants requis pour ce scnario : tRowGenerator, tSortRow et tLogRow. Connectez-les laide de liens de type Row Main. Dans le RowGenerator editor, dfinissez les valeurs qui seront cres de manire alatoire et qui seront ensuite tries par le tSortRow. Pour plus dinformations concernant lutilisation du tRowGenerator, consultez la section intitule Proprits du tRowGenerator

Dans ce scnario, chaque vendeur est class en fonction de la valeur de ses ventes (Sales) et de son anciennet dans lentreprise (YearsInComp). Double-cliquez sur tSortRow pour afficher longlet Basic settings. Dfinissez la priorit de tri sur la valeur des ventes et, en second critre, sur lanciennet.

1556

Guide de Rfrence des Composants Talend Open Studio

Scnario : Trier des donnes

Utilisez le bouton [+] pour ajouter le nombre de lignes de critres requis. Paramtrez le type de tri, dans cet exemple, les deux critres sont de type numrique. Enfin, tant donn que la sortie est une classification, dfinissez lordre de tri comme descendant. Dans longlet Advanced Settings, cochez loption Sort on disk pour modifier les paramtres de la mmoire temporaire. Dans le champ Temp data directory path, renseignez le chemin daccs au dossier dans lequel vous voulez stocker les donnes temporaires. Dans le champ Buffer size of external sort, dfinissez la taille maximale de la mmoire tampon allouer au traitement des donnes. La valeur par dfaut de la mmoire tampon est de 1000000 mais plus vous traitez un nombre important de lignes et/ou colonnes, plus cette valeur devra tre leve pour viter linterruption automatique du Job signifie par le message derreur out of memory. Assurez-vous que ce flux est connect au composant de sortie tLogRow, afin dafficher le rsultat dans la console Run. Appuyez sur F6 pour excuter le Job ou passez la vue Run et cliquez sur le bouton Run. Le classement est dabord bas sur la valeur des ventes puis sur le nombre dannes danciennet.

Guide de Rfrence des Composants Talend Open Studio

1557

tSplitRow

tSplitRow

Proprits du tSplitRow
Famille de composant Fonction Objectif Basic settings Processing/Fields Le composant tSplitRow dcoupe une ligne en plusieurs lignes. Ce composant vous permet de sparer une ligne d'entre en plusieurs lignes de sortie. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez Edit Schema pour modifier le schma. Notez que si vous effectuez des modifications, le schma devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent dans le Job. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Columns mapping Cliquez sur le bouton [+] pour ajouter autant de lignes que ncessaire pour effectuer le mapping des colonnes d'entre vers les colonnes de sortie. Cochez cette case pour collecter les donnes de log, aussi bien au niveau du Job quau niveau de chaque composant.

Advanced settings

tStatCatcher Statistics

Utilisation Limitation

Ce composant dcoupe une ligne d'entre en de multiples lignes de sortie, en mappant les colonnes d'entre vers les colonnes de sortie. n/a

Scnario 1 : Sparer une ligne en plusieurs lignes


Ce scnario dcrit un Job a trois composants. Une ligne de donnes contenant des informations concernant deux entreprises sera spare en deux lignes.

1558

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Sparer une ligne en plusieurs lignes

1. Dposez les composants suivants de la Palette dans l'espace de modlisation graphique : tFixedFlowInput, tSplitRow et tLogRow. 2. Reliez-les l'aide de liens Row Main. 3. Double-cliquez sur le tFixedFlowInput afin d'ouvrir sa vue Basic settings.

4. Slectionnez Use Inline Content(delimited file) dans la zone Mode. 5. Dans la zone Content, saisissez les scripts suivants : Talend;LA;California;537;5thAvenue;IT;Lionbridge;Memphis;Tennessee;537;Lincoln Road;IT Service; 6. Cliquez sur Edit schema pour ouvrir une bote de dialogue afin d'diter le schma des donnes d'entre.

7. Cliquez sur le bouton [+] pour ajouter douze colonnes d'entre : Company, City, State, CountryCode, Street, Industry, Company2, City2, State2, CountryCode2, Street2 et Industry2. 8. Cliquez sur OK pour fermer la bote de dialogue. 9. Double-cliquez sur le composant tSplitRow afin d'ouvrir sa vue Basic settings.

Guide de Rfrence des Composants Talend Open Studio

1559

Scnario 1 : Sparer une ligne en plusieurs lignes

10.Cliquez sur Edit schema pour configurer le schma des donnes de sortie.

11.Cliquez sur le bouton [+] sous la table tSplitRow_1(Output) affin d'ajouter quatre colonnes de sortie : Company, CountryCode, Address et Industry. 12.Cliquez sur OK pour fermer la bote de dialogue. Une table vide contenant le nom des colonnes dfinies dans l'tape prcdente apparat dans la zone Columns mapping :

13.Cliquez sur le bouton [+] sous la table Columns mapping afin d'ajouter deux lignes de sortie. 14.Renseignez la table Columns mapping en saisissant les valeurs suivantes dans les colonnes : Company: row1.Company, row1.Company2; Country: row1.CountryCode, row1.CountryCode2;

1560

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Sparer une ligne en plusieurs lignes

Address: row1.Street+","+row1.City+","+row1.State, row1.Street2+","+row1.City2+","+row1.State2; Industry: row1.Industry, row1.Industry2;

La valeur dans la colonne Address, par exemple, row1.Street+","+row1.City+","+row1.State, affiche une adresse absolue en combinant les valeurs des colonnes Street, City et State. "row1" utilis dans les valeurs de chaque colonne fait rfrence la ligne d'entre du tFixedFlowInput. 15.Double-cliquez sur le tLogRow afin d'ouvrir sa vue Basic settings.

16.Cliquez sur le bouton Sync columns pour rcuprer le schma dfini dans le composant prcdent. 17.Slectionnez Table (print values in cells of a table) dans la zone Mode. 18.Sauvegardez le Job et appuyez sur F6 pour l'excuter.

Les donnes d'entre en une ligne sont spares en deux lignes diffrentes, chaque ligne contenant es informations d'une des deux entreprises.

Guide de Rfrence des Composants Talend Open Studio

1561

tWriteJsonField

tWriteJsonField

Proprits du tWriteJsonField
Famille de composant Fonction Objectif Basic settings Processing/Fields Le composant tWriteJsonField crit des objets JSON dans le champ dfini d'un fichier de sortie. Le tWriteJsonField lit des donnes d'un fichier d'entre, les assemble en objets JSON et les crit dans le champ dfini d'un fichier de sortie. Output Column Slectionnez le champ de destination du composant de sortie dans lequel vous souhaitez crire les objets JSON. Ouvrez l'interface supportant la cration de la structure de donnes JSON que vous souhaitez crire dans un champ. Pour plus d'informations concernant l'interface, consultez la section intitule Dfinir un arbre XML .

Configure JSON Tree

Schema type et Edit Un schma est une description de lignes, i.e., il dfinit Schema le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Sync columns Cliquez sur ce bouton pour synchroniser le schma du fichier de sortie et le schma du fichier d'entre. La fonction Sync s'affiche uniquement lorsque le lien Row est connect au composant de sortie. Dfinissez l'ensemble d'agrgation, les colonnes que vous souhaitez utiliser pour regrouper les donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Group by Advanced settings tStatCatcher Statistics

Utilisation Limitation

Ce composant est utilis comme tape intermdiaire dans un flux de donnes. n/a

Scnario associ
Pour un scnario associ, consultez la section intitule tWriteXMLField du composant tWriteXMLField.

1562

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Guide de Rfrence des Composants Talend Open Studio

1563

tXMLMap

tXMLMap

Proprits du tXMLMap
Famille de composant Fonction Processing/XML Le composant tXMLMap est un composant avanc personnalisable permettant de transformer et de router des flux de donnes XML (donnes de type document), particulirement pour traiter de nombreuses sources de donnes XML, avec ou sans jointure sur les donnes plates. Le tXMLMap transforme et route des donnes partir dune ou plusieurs source(s) de donnes vers une ou plusieurs destination(s). Map editor Le Map Editor vous permet de dfinir les proprits du routage et des transformations du tXMLMap.

Objectif Basic settings Advanced settings Utilisation

tStatCatcher Sta- Cochez cette case pour collecter les donnes de log au niveau tistics du Job ainsi quau niveau de chaque composant. Plusieurs utilisations sont possibles, de la simple rorganisation des champs de donnes aux transformations les plus complexes, telles que le multiplexage et le dmultiplexage de donnes, la concatnation, linversion, le filtrage, etc. Lorsque c'est ncessaire, vous pouvez dfinir vos sorties pour les flux XML, l'aide de l'lment "group", de l'lment "aggregate", d'lments vides et de toute autre fonctionnalit, comme All in one. Pour plus d'informations concernant ces fonctionnalits, consultez le Guide utilisateur de Talend Open Studio. Ce composant est utilis comme composant intermdiaire et correspond parfaitement au processus ncessitant de nombreuses sources de donnes XML, comme les processus ESB de requte/rponse.

Limitation

Les limites sont les suivantes : - Lutilisation du composant tXMLMap requiert des connaissances minimales en Java et XML afin dexploiter au mieux ses fonctionnalits. - Ce composant est une tape de jonction. Il ne peut donc tre ni un composant dentre, ni un composant de sortie. - Un seul lment de boucle est requis pour chaque flux de donnes XML.

Les sections suivantes prsentent plusieurs scnarios gnriques concernant l'utilisation du composant tXMLMap. Si vous souhaitez consulter des exemples spcifiques d'utilisation de ce composant avec les composants ESB afin de construire des services de donnes, consultez le Guide utilisateur de Talend ESB Studio (en anglais). Si vous souhaitez plus d'informations concernant les principes du mapping de multiples flux d'entre et de sortie, consultez le Guide utilisateur de Talend Open Studio.

1564

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Mapper et transformer des donnes de source XML

Scnario 1 : Mapper et transformer des donnes de source XML


Dans ce scnario, un Job trois composants est excut pour mapper et transformer des donnes provenant dune source XML, customer.xml, et gnrer un flux de sortie XML pouvant tre rutilis dans diffrents buts, comme, par exemple, pour une requte ESB. Ces trois composants sont : tFileInputXML : ce composant est utilis pour fournir des donnes dentre au tXMLMap. tXMLMap : ce composant mappe et transforme les flux de donnes XML en un seul flux de donnes XML. tLogRow : ce composant est utilis pour afficher les donnes de sortie.

Afin de reproduire ce scnario, procdez comme dans les sections suivantes :

Dposer et relier les composants


Pour ce faire, procdez comme suit : 1. De la Palette, dposez un tFileInputXML, un tXMLMap et un tLogRow dans lespace de modlisation graphique. Un composant utilis dans lespace de modlisation peut tre renomm comme vous le souhaitez. Dans ce scnario, le composant dentre est nomm Customers. Pour plus dinformations concernant le renommage dun composant, consultez le Guide utilisateur de Talend Open Studio. 2. Double-cliquez sur le composant tFileInputXML nomm Customers pour ouvrir son menu contextuel. 3. Dans ce menu, slectionnez Row > Main afin de relier ce composant au tXMLMap. 4. Rptez lopration afin de connectez ensuite le tXMLMap au tLogRow laide dun lien Row > *New output* (Main). Une bote de dialogue souvre et vous demande de nommer ce lien de sortie. Dans ce scnario, nommez-le Customer_States.

Vous pouvez ensuite continuer configurer vos composants.

Guide de Rfrence des Composants Talend Open Studio

1565

Scnario 1 : Mapper et transformer des donnes de source XML

Configurer le flux d'entre


Pour ce faire, procdez comme suit : 1. Double-cliquez sur le composant tFileInputXML nomm Customers afin dafficher sa vue Basic settings.

2. A ct du champ Edit schema, cliquez sur le bouton [...] afin douvrir lditeur du schma.

3. Dans lditeur du schma, cliquez sur le bouton [+] pour ajouter une ligne. 4. Dans la colonne Column, saisissez un nouveau nom pour cette ligne. Dans ce scnario, le nom est Customer. 5. Dans la colonne Type, slectionnez le type de donnes de cette ligne. Dans ce scnario, le type est Document. Le type de donnes document est essentiel pour utiliser au maximum les fonctionnalits du tXMLMap. Pour plus dinformations concernant ce type de donnes, consultez le Guide utilisateur de Talend Open Studio. 6. Cliquez sur OK pour valider ce changement et acceptez la propagation propose par la fentre pop-up. Une ligne est ajoute automatiquement la table Mapping. 7. Dans le champ File name / Stream, parcourez votre systme jusquau fichier XML source fournissant les donnes client, ou bien saisissez son chemin daccs. 8. Dans le champ Loop XPath query, saisissez / pour remplacer le paramtre par dfaut. Cela signifie que les donnes source sont interroges depuis la racine.

1566

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Mapper et transformer des donnes de source XML

9. Dans la colonne XPath query de la table Mapping, saisissez le XPath. Dans ce scnario, saisissez ., ce qui signifie que toutes les donnes de la source seront interroges. 10.Cochez la case Get Nodes dans la colonne de la table Mapping. Afin de construire le flux de donnes de type Document, il est ncessaire d'obtenir les nuds de ce composant.

Configurer le tXMLMap pour effectuer des transformations


Pour ce faire, procdez comme suit : 1. Double-cliquez sur le composant tXMLMap pour ouvrir le Map Editor. Notez que la zone dentre est dj remplie par les tables dentre dfinies et que la table suprieure est la table principale dentre (flux Main). 2. Dans la table gauche, cliquez-droit sur Customer pour ouvrir le menu contextuel.

3. Dans ce menu contextuel, slectionnez Import From File et dans la fentre pop-up, parcourez votre systme jusquau fichier source correspondant, afin dimporter la structure XML utilise par les donnes reues par le tXMLMap. Dans ce scnario, le fichier source est Customer.xml, qui est galement connects au tFileInputXML (Customers). Vous pouvez galement importer une arborescence XML partir d'un fichier XSD. Lors de l'import d'une structure XML d'entre ou de sortie depuis un fichier XSD, vous pouvez choisir un lment pour en faire la racine de votre structure XML. Pour plus d'informations concernant l'import d'une arborescence XML partir d'un fichier XSD, consultez le Guide utilisateur de Talend Open Studio. 4. Dans la table du ct gauche, cliquez-droit sur le nud Customer et slectionnez As loop element pour le dfinir comme lment de boucle.

5. Dans la partie infrieure du Map Editor, cliquez sur longlet Schema editor afin dafficher la vue correspondante. 6. Du ct droit de cette vue, cliquez sur le bouton [+] pour ajouter une ligne la table Customer et renommez cette ligne Customer_States.

Guide de Rfrence des Composants Talend Open Studio

1567

Scnario 1 : Mapper et transformer des donnes de source XML

7. Dans la colonne Type de la ligne Customer_States, slectionnez Document comme type de donnes. La racine XML correspondante est ajoute automatiquement la table suprieure, du ct droit, qui reprsente le flux de sortie.

8. Du ct droit de la table suprieure nomme Customer_States, importez la structure XML des donnes que vous devez utiliser du fichier source XML correspondant. Dans ce scnario, le fichier est Customer_State.xml.

9. Cliquez-droit sur le nud customer et slectionnez As loop element dans le menu contextuel. Vous pouvez ensuite commencer mapper le flux dentre vers le flux de sortie. 10.Dans la table du ct de lentre (gauche) du Map Editor, cliquez sur le nud id et glissez-le dans la colonne Expression dans la ligne correspondant la ligne de sortie que vous devez mapper. Dans ce scnario, le nud est @id.

1568

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Mapper et transformer des donnes de source XML

11.Rptez lopration pour mapper CustomerName CustomerName, CustomerAddress CustomerAddress et idState idState du ct gauche au ct droit. Dans un projet rel, vous pouvez avoir besoin de laisser des lments vides dans votre arborescence XML de sortie. Dans ce cas, vous pouvez utiliser le tXMLMap pour les grer. Pour plus d'informations concernant la gestion des lments vides via le tXMLMap, consultez le Guide utilisateur de Talend Open Studio. 12.Si ncessaire pour gnrer plusieurs flux XML, cliquez sur la cl anglaise en haut droite afin d'ouvrir le panneau de paramtrage du mapping et configurer la fonctionnalit All in one comme true. Dans cet exemple, cette option est sur true. Pour plus d'informations concernant la fonctionnalit All in one, consultez le Guide utilisateur de Talend Open Studio.

13.Cliquez sur OK pour valider le mapping et fermer le Map Editor. Si vous fermez le Map Editor sans avoir dfini les lments de boucle ncessaires, comme expliqu plus tt dans ce scnario, une icne d'erreur apparat dans le coin suprieur droit du composant tXMLMap, dans l'espace de modlisation graphique.

Excuter le Job
Appuyez sur F6 pour excuter le Job.

Guide de Rfrence des Composants Talend Open Studio

1569

Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML

Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML
Bas sur le scnario prcdent, ce scnario explique comment utiliser un flux Lookup (de rfrence) dans un flux XML afin deffectuer une jointure sur les donnes souhaites dans le flux XML donn. Les donnes XML de rfrence sont contenues dans le fichier USstates.xml. Pour ce faire, un composant tFileInputXML est ajout au Job prcdent afin de charger et denvoyer des donnes complmentaires au tXMLMap. Le Job doit ressembler ceci :

Pour reproduire ce scnario, procdez comme dans les sections suivantes.

Configurer le flux de donnes pour le flux de rfrence


Pour ce faire, procdez comme suit : 1. De la Palette, dposez un composant tFileInputXML dans lespace de modlisation graphique. Un composant utilis dans lespace de modlisation peut tre renomm comme vous le souhaitez. Dans ce scnario, le composant ajout est nomm USStates. Pour plus dinformations concernant le renommage dun composant, consultez le Guide utilisateur de Talend Open Studio. 2. Cliquez-droit sur le composant tFileInputXML nomm USStates pour ouvrir son menu contextuel et slectionnez Row > Main afin de relier ce composant au tXMLMap. Puisque cette connexion Row est la seconde que vous crez, elle est de type Lookup. 3. Double-cliquez sur le composant tFileInputXML nomm USStates pour ouvrir sa vue Component.

1570

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML

4. A ct du champ Edit schema, cliquez sur le bouton [...] pour ouvrir lditeur du schma. 5. Dans lditeur, cliquez sur le bouton [+] pour ajouter une ligne et renommez-la USState, par exemple. 6. Dans la colonne Type, slectionnez Document dans la liste droulante.

7. Cliquez sur OK pour valider les modifications et accepter la propagation propose par la bote de dialogue qui souvre. 8. Dans le champ File name/Stream, parcourez votre systme ou saisissez le chemin daccs au fichier USStates.xml. Les schmas dentre peuvent tre stocks dans le nud Metadata de la vue Repository pour que vous puissiez les retrouver facilement. Pour plus dinformations concernant la cration de mtadonnes dans le Repository, consultez le Guide utilisateur de Talend Open Studio. 9. Dans le champ Loop XPath query, saisissez "/" afin de remplacer la valeur par dfaut. Cela signifie que la boucle est base sur la racine. 10.Dans la table Mapping, o une ligne est dj ajoute automatiquement, saisissez "." dans la colonne XPath query, afin de rcuprer les Etats des Etats-Unis depuis le fichier source. 11.Dans la colonne Get Nodes, cochez la case. Cela va rcuprer la structure XML des donnes de type Document.

Guide de Rfrence des Composants Talend Open Studio

1571

Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML

Configurer la transformation
Pour ce faire, procdez comme suit : 1. Double-cliquez sur le composant tXMLMap pour ouvrir le Map Editor. Notez que la zone dentre est dj remplie par les tables dentre dfinies et que la table suprieure est la table principale dentre (flux Main). 2. Dans la table suprieure, cliquez-droit sur le nud idState et dposez-le, dans la table infrieure, dans la colonne Exp.key correspondant la ligne idState. Cela cre une jointure entre les deux tables sur les donnes idState, parmi lesquelles le nud idState du flux principal fournit la cl de rfrence (lookup key).

Vous pouvez commencer modifier le mapping du scnario prcdent afin deffectuer une jointure sur les donnes plates du flux dentre. Le mapping doit ressembler ceci :

1572

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML

3. Dans la table lookup de gauche dans lditeur, cliquez sur la ligne LabelState et dposez-la sur le nud customer de la sortie. Une bote de dialogue souvre.

4. Dans cette bote de dialogue, slectionnez Create as sub-element of target node puis cliquez sur OK. Cette opration ajoute un sous-lment dans larborescence XML de sortie et le mappe galement avec LabelState dans lentre. 5. Si ncessaire pour gnrer plusieurs flux XML, cliquez sur la cl anglaise en haut droite afin d'ouvrir le panneau de paramtrage du mapping et configurer la fonctionnalit All in one comme true. Dans cet exemple, cette option est sur true. Pour plus d'informations concernant la fonctionnalit All in one, consultez le Guide utilisateur de Talend Open Studio.

Guide de Rfrence des Composants Talend Open Studio

1573

Scnario 3 : Mapper des donnes laide dun filtre

6. Cliquez sur OK pour valider le mapping et fermer le Map Editor. 7. Appuyez sur F6 pour excuter le Job. La vue Run affiche les rsultats de lexcution.

Les libells US State correspondants lID de ltat fourni comme cl de rfrence par le flux principal sont slectionns et crits en sortie.

Scnario 3 : Mapper des donnes laide dun filtre


Ce scnario se base sur la section intitule Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML et explique comment appliquer une (des) condition(s) de filtre pour slectionner les donnes qui vous intressent, laide du tXMLMap. Par exemple, vous souhaitez slectionner les donne clients pour lesquelles lID de ltat est 9. Pour reproduire ce scnario, procdez comme suit : 1. Dans votre Studio, ouvrez le Job utilis dans le scnario prcdent afin de lafficher dans lespace de modlisation graphique.

1574

Guide de Rfrence des Composants Talend Open Studio

Scnario 3 : Mapper des donnes laide dun filtre

2. Double-cliquez sur le tXMLMap pour ouvrir son diteur. Dans cet diteur, les flux dentre et de sortie sont dj mapps puisque le Job est rpliqu du scnario prcdent.

3. Du ct de la sortie ( droite), cliquez sur le bouton pour ouvrir la zone de filtre.

Guide de Rfrence des Composants Talend Open Studio

1575

Scnario 3 : Mapper des donnes laide dun filtre

4. Dans cette zone de filtre, dposez le nud idState du flux dentre. Le chemin Xpath de lidState est ajout automatiquement dans cette zone de filtre. 5. Toujours dans cette zone, saisissez votre condition de filtre en Java. Dans ce scnario, la condition est la suivante : "9".equals([row1.Customer:/Customers/Customer/Address/idState]) 6. Si ncessaire pour gnrer plusieurs flux XML, cliquez sur la cl anglaise en haut droite afin d'ouvrir le panneau de paramtrage du mapping et configurer la fonctionnalit All in one comme true. Dans cet exemple, cette option est sur true. Pour plus d'informations concernant la fonctionnalit All in one, consultez le Guide utilisateur de Talend Open Studio.

7. Cliquez sur OK pour valider les modifications et fermer lditeur. 8. Appuyez sur F6 pour excuter ce Job. Les rsultats dexcution saffichent dans la vue Run :

1576

Guide de Rfrence des Composants Talend Open Studio

Scnario 4 : Capturer les donnes rejetes par le flux Lookup et le filtre

Les rsultats montrent que le client Pivot Point College est slectionn, puisque lID de son tat est 9, ce qui reprsente la Floride dans ce scnario.

Scnario 4 : Capturer les donnes rejetes par le flux Lookup et le filtre


Les donnes rejetes par le flux Lookup et les conditions de filtre dfinies dans le tXMLMap peuvent tre captures et crites en sortie par le composant lui-mme. Ce scnario se base sur la section intitule Scnario 3 : Mapper des donnes laide dun filtre , et explique comment capturer les donnes rejetes par le flux Lookup et les filtrer dfini dans les sections prcdentes. Dans ce scnario, un autre composant tLogRow est ajout au Job du scnario prcdent. Le Job ressemble ceci :

Pour reproduire ce scnario, procdez comme suit : 1. Dans le Studio, ouvrez le Job utilis dans le scnario prcdent dans lespace de modlisation graphique. 2. De la Palette, dposez le composant tLogRow dans lespace de modlisation graphique. 3. Cliquez sur le tXMLMap pour ouvrir son menu contextuel. Dans ce menu, slectionnez Row > *New Output* (Main) pour connecter ce composant au nouveau tLogRow. Une bote de dialogue souvre et vous demande de nommer ce lien de sortie. Dans ce scnario, nommez le lien Reject.

Guide de Rfrence des Composants Talend Open Studio

1577

Scnario 4 : Capturer les donnes rejetes par le flux Lookup et le filtre

4. Cliquez sur OK pour valider la cration. 5. Double-cliquez sur le composant tXMLMap pour ouvrir son diteur. Une table Reject vide a t ajoute la sortie pour reprsenter le flux de sortie contenant les donnes rejetes. Vous devez complter cette table afin que lditeur ressemble ceci :

6. Slectionnez cette table vide Reject. 7. Dans la partie infrieure de lditeur, cliquez sur longlet Schema editor pour ouvrir la vue correspondante. 8. Dans la partie droite de la vue Schema editor, cliquez sur le bouton [+] pour ajouter la table les lignes que vous souhaitez utiliser. Dans ce scnario, cliquez quatre fois pour ajouter quatre lignes la table Reject.

1578

Guide de Rfrence des Composants Talend Open Studio

Scnario 4 : Capturer les donnes rejetes par le flux Lookup et le filtre

9. Dans la table Reject droite de la vue Schema editor, renommez les lignes ajoutes. Renommez-les respectivement : ID, Customer, idState, et LabelState. Dans ce scnario, les donnes du flux de sortie sont des donnes plates. Cependant, vous pouvez crer une arborescence XML laide du type de donnes document. Pour plus dinformations concernant lutilisation du type document, consultez la section intitule Scnario 1 : Mapper et transformer des donnes de source XML . La table Reject est complte et vous avez dfini le schma du flux de sortie utilis pour capturer les donnes rejetes. Vous devez ensuite configurer la (les) condition(s) pour capturer les donnes rejetes qui vous intressent. 10.Dans la partie suprieure de la sortie dans le Map editor, slectionnez la table Reject. 11. En haut de cette table, cliquez sur le bouton pour ouvrir la zone de configuration.

12.Dans la ligne Catch Output Reject de la zone de configuration, slectionnez true dans la liste droulante. Ainsi, le tXMLMap crit les donnes rejetes par le filtre dfini pour le flux de sortie Customer dans le scnario prcdent. 13.Rptez lopration pour slectionner true dans la ligne Catch Lookup Inner Join Reject. 14.Cliquez sur OK pour valider vos modifications et fermer lditeur. 15.Appuyez sur F6 pour excuter le Job. Les donnes captures rejetes par le flux Lookup et le filtre saffichent comme suit dans la vue Run :

Guide de Rfrence des Composants Talend Open Studio

1579

Scnario 5 : Mapper des donnes laide dun lment group

Les tats de ces clients nont pas lID 9. LID de ltat du client BBQ Smiths Tex Mex est 60. Ce nombre nexiste pas dans la colonne idState du fichier USState.txt pour laquelle le Lookup dfini a t effectu. Ainsi, les donnes de ce client sont rejetes par le flux Lookup et les autres donnes sont rejetes par le filtre. Les donnes slectionnes par le filtre dfini dans le scnario prcdent saffiche comme suit au format XML.

Scnario 5 : Mapper des donnes laide dun lment group


Ce scnario se base sur le Job utilis dans la section intitule Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML et explique comment dfinir un lment en tant que group element dans le Map editor du tXMLMap afin de regrouper les donnes de sortie.

Pour reproduire ce scnario, vous pouvez rutiliser le Job dans la section intitule Scnario 2 : Crer un flux Lookup pour effectuer une jointure sur des donnes complmentaires XML Dans ce Job, double-cliquez sur le tXMLMap afin d'ouvrir le Map Editor.

1580

Guide de Rfrence des Composants Talend Open Studio

Scnario 5 : Mapper des donnes laide dun lment group

L'objectif de ce scnario est de regrouper les IDs des clients et les informations relatives aux clients, selon l'Etat dans lequel ils rsident. Pour ce faire, vous devez ajuster la structure XML, en prenant en compte les facteurs suivants : Les lments relatifs l'ID et au nom des clients doivent tre situs sous l'lment de boucle. Ils sont donc des sous-lments de la boucle. L'lment de boucle et ses sous-lments doivent dpendre directement de l'lment de groupe. L'lment relatif l'Etat utilis comme condition de groupe doit dpendre directement de l'lment de groupe. L'lment de groupe ne peut pas tre l'lment racine. A partir de cette analyse, la structure des donnes de sortie doit se prsenter comme suit :

Guide de Rfrence des Composants Talend Open Studio

1581

Scnario 5 : Mapper des donnes laide dun lment group

Dans la capture d'cran, le nud customers est la racine, l'lment Customer est le group element et les donnes de sortie sont regroupes selon l'lment LabelState. Pour dfinir un lment de groupe, deux restrictions doivent tre respectes : Le nud ne peut tre dfini comme group element ; la dfinition du group element doit se faire sur le nud pre de l'lment de boucle. Une fois l'lment de groupe dfini, le premier lment (en-dehors de celui de boucle) est utilis comme condition de groupe des donnes de sortie. Pour effectuer l'ajustement selon cette analyse, procdez comme suit : 1. Dans larborescence XML de la sortie, cliquez-droit sur le nud racine customers pour ouvrir le menu contextuel et slectionnez Delete. Tous les lments sous la racine customers sont supprims. Vous pouvez reconstruire l'arborescence XML afin d'obtenir la meilleure structure pour grouper vos donnes.

2. Dans l'arborescence XML de la sortie, cliquez-droit sur le nud racine customers afin d'ouvrir le menu contextuel et slectionnez Create sub-element. Une bote de dialogue s'ouvre.

1582

Guide de Rfrence des Composants Talend Open Studio

Scnario 5 : Mapper des donnes laide dun lment group

3. Saisissez le nom du sous-lment. Dans ce scnario, le nom est Customer. 4. Rptez les oprations prcdentes afin de crer deux sous-lments supplmentaires sous le nud Customer. Nommez-les : LabelState et Name. 5. Rptez ces oprations encore une fois afin de crer deux sous-lments sous le nud Name. Nommez-les : id et CustomerName. 6. Cliquez-droit sur le nud Name pour ouvrir le menu contextuel et slectionnez As loop element pour dfinir cet lment comme lment de boucle. 7. Cliquez-droit sur le nud Customer pour ouvrir son menu contextuel et slectionnez As group element. Cela signifie que les donnes de sortie sont regroupes dans llment LabelState. 8. Dans le flux Lookup de donnes, glissez-dposez la ligne LabelState dans la ligne du nud LabelState de la colonne Expression dans la table de sortie. Les donnes correspondantes sont mappes. 9. Rptez lopration pour mapper llment id et les lments CustomerName des deux cts.

10.Si ncessaire pour gnrer plusieurs flux XML, cliquez sur la cl anglaise en haut droite afin d'ouvrir le panneau de paramtrage du mapping et configurer la fonctionnalit All in one comme true. Dans cet exemple, cette option est sur true. Pour plus d'informations concernant la fonctionnalit All in one, consultez le Guide utilisateur de Talend Open Studio. 11.Cliquez sur OK pour valider les modifications et fermer lditeur. Si vous fermez le Map Editor sans avoir dfini les lments de boucle ncessaires, comme expliqu plus tt dans ce scnario, une icne d'erreur apparat dans le coin suprieur droit du composant tXMLMap, dans l'espace de modlisation graphique.

Guide de Rfrence des Composants Talend Open Studio

1583

Classer les donnes de sortie avec l'lment "aggregate"

12.Appuyez sur F6 pour excuter le Job. Les rsultats dexcution saffichent comme suit dans la vue Run.

Les lments id et CustomerName contenus dans la boucle sont regroups dans llment LabelState. La balise du group element Customer marque le dbut et la fin de chaque groupe. Le composant tXMLMap propose les lments "group" et "aggregate" pour classer les donnes dans une structure XML. Lors de la gestion d'une ligne de donnes (flux XML complet), la diffrence de comportement est la suivante : L'lment "group" traite toujours les donnes dans un flux unique. L'lment "aggregate" spare ce flux en diffrents flux XML complets.

Classer les donnes de sortie avec l'lment "aggregate"


A partir du Job dans la section intitule Scnario 5 : Mapper des donnes laide dun lment group , ce scnario explique comment dfinir un lment "aggregate element" dans le Map Editor du tXMLMap, afin de classer les donnes de sortie dans des flux XML spars.

Dans l'espace de modlisation graphique, double-cliquez sur le composant tXMLMap afin d'ouvrir son Map editor. La sortie s'affiche comme suit :

1584

Guide de Rfrence des Composants Talend Open Studio

Classer les donnes de sortie avec l'lment "aggregate"

L'objectif de ce scnario est d'agrger les informations client selon les Etats de rsidence, l'aide de l'lment aggregate, puis d'envoyer ces donnes sparment dans diffrents flux XML vers le composant suivant. Pour ce faire, ajustez l'arborescence XML comme suit : 1. Cliquez-droit sur l'lment Customer afin d'ouvrir son menu contextuel et slectionnez Remove group element. 2. Cliquez sur la cl anglaise en haut droite afin d'ouvrir le panneau de paramtrage du mapping et configurer la fonctionnalit All in one comme false. 3. Cliquez-droit sur l'lment LabelState afin d'ouvrir son menu contextuel puis slectionnez As aggregate element. Cet lment ajoute des balises relatives aux informations d'Etat de chaque client et les informations clients sont classes sous les informations d'Etats (State). Afin de rendre l'lment "aggregate" disponible, vrifiez que la fonctionnalit All in one est configure sur false. Pour plus d'informations concernant cette fonctionnalit, consultez le Guide utilisateur de Talend Open Studio. 4. Cliquez sur OK afin de valider ces modifications et fermer le Map editor. 5. Appuyez sur F6 pour excuter ce Job. La vue Run s'ouvre automatiquement, dans laquelle vous pouvez vrifier les rsultats d'excution.

Le tXMLMap crit trois flux XML spars, chacun d'entre eux contenant les informations d'un Etat et des clients vivant dans cet Etat.

Guide de Rfrence des Composants Talend Open Studio

1585

Classer les donnes de sortie avec l'lment "aggregate"

Le composant tXMLMap propose les lments "group" et "aggregate" pour classer les donnes dans une structure XML. Lors de la gestion d'une ligne de donnes (flux XML complet), la diffrence de comportement est la suivante : L'lment "group" traite toujours les donnes dans un flux unique. L'lment "aggregate" spare ce flux en diffrents flux XML complets.

1586

Guide de Rfrence des Composants Talend Open Studio

Composants System
Ce chapitre passe en revue les principaux composants de la famille System de la Palette de Talend Open Studio. La famille System regroupe les composants permettant dinteragir avec votre systme dexploitation.

Guide de Rfrence des Composants Talend Open Studio

tRunJob

tRunJob

Proprits du tRunJob
Famille de composant Fonction Objectif Basic settings System Le composant tRunJob excute le Job spcifi dans ses proprits dans un contexte dfini. Le tRunJob permet de matriser des systmes de Job complexes devant tre excuter lun aprs lautre. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma dans cette vue, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent dans le Job. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement : Guide utilisateur de Talend Open Studio. Use dynamic job Cochez cette case afin de pouvoir appeler et traiter de nombreux Jobs. Lorsque cette case est coche, seule la dernire version des Jobs peut tre appele et traite. Un processus indpendant sera utilis pour excuter le sousjob. Les options Context et Use an independent process to run subjob disparaissent. Ce champ est visible uniquement lorsque loption Use dynamic job est coche. Saisissez le nom du Job que vous souhaitez appeler dans la liste des Jobs slectionns.

Context job

CopyChild Job Schema Cliquez sur ce bouton pour rcuprer le schma du Job fils. Job Slectionnez le Job appeler et traiter. Assurez-vous que le Job appel ait t excut au moins une fois auparavant pour que son excution via le tRunJob se droule le mieux possible. Slectionnez la version du Job fils que vous souhaitez utiliser.

Version

1588

Guide de Rfrence des Composants Talend Open Studio

Proprits du tRunJob

Context

Si vous avez paramtr des contextes et des variables pour les Jobs excuter via le tRunJob, slectionnez dans la liste le contexte appliquer.

Use an independent Cochez cette case afin dutiliser un processus idpendant process to run subjob pour excuter le sous-job. Cela vous permettra de rsoudre des problmes lis la taille limite de la mmoire. Die on child error Dcochez cette case pour excuter le Job parent mme sil y a une erreur lors de lexcution du Job fils.

Transmit whole context Cochez cette case pour obtenir les contextes du Job parent. Dcochez-la pour obtenir les contextes du Job fils. Context Param Vous pouvez modifier les paramtres de contexte slectionns. Cliquez sur le bouton [+] pour ajouter les paramtres tels quils ont t dfinis dans le contexte du Job fils. Pour plus dinformations sur les paramtres de contexte, consultez le Guide utilisateur de Talend Open Studio. Advanced settings Print Parameters tStatCatcher Statistics Utilisation Cochez cette case pour afficher les paramtres internes et externes dans la Console. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en Job standalone ou peut aider clarifier certains Jobs complexes en vitant davoir un nombre important de sous-jobs dans le mme Job. Child return code : indique le code de retour Java du Job fils. Disponible comme variable After. Retourne un entier : sans erreur > la valeur du code est 0. avec erreur(s) > un message derreur apparat. Child exception stack trace : retourne la trace de la pile Java dun Job fils. Disponible comme variable After. Retourne une chane de caractres. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio.

Global Variables

Connections

Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize.

Guide de Rfrence des Composants Talend Open Studio

1589

Scnario : Excuter un Job fils

Pour plus dinformations concernant les liens, consultez le Guide utilisateur Talend Open Studio. Limitation n/a

Scnario : Excuter un Job fils


Le scnario suivant dcrit un Job un composant appelant et excutant un autre Job. Le Job excuter lit une liste de fichiers dlimits de base et affiche son contenu dans la console de la vue Run. La particularit de ce Job rside dans le fait que ce dernier est excut partir dun autre Job et utilise la variable de contexte provenant du fichier dentre devant tre trait.

Crez le premier Job lisant un fichier dlimit. A partir de la Palette, cliquez et dposez les composants tFileInputDelimited et tLogRow dans lespace de modlisation. Connectez ces deux composants laide dun lien de type Row Main. Double-cliquez sur le composant tFileInputDelimited pour afficher la vue Basic settings et paramtrer les proprits du composant dentre. Dans la liste droulante Property Type, slectionnez loption Built-In.

Cliquez dans le champ File Name puis appuyez sur la touche F5 pour ouvrir la fentre de configuration de variable.

1590

Guide de Rfrence des Composants Talend Open Studio

Scnario : Excuter un Job fils

Nommez File cette nouvelle variable de contexte.

Pour cet exemple, laissez les paramtres par dfaut, i.e. ne cochez pas la case Prompt for value et laissez le champ Prompt vide. Cliquez sur Finish pour valider puis appuyez sur Enter pour vous assurer que la nouvelle variable de contexte est conserve dans le champ File Name. Dans les champs Field separator et Row separator de longlet Basic settings, renseignez respectivement les sparateurs de champs et de lignes utiliss dans le fichier dentre. Dans cet exemple, les fichiers ne possdent ni en-tte ni pied de page. Ainsi, laissez les champs Header et Footer vides. Les fichiers sont relativement courts, vous pouvez donc laisser le champ Limit vide. Dans la liste droulante Schema type, slectionnez loption Built-in. Cliquez sur le bouton [...] pour configurer manuellement le schma. Ajoutez deux colonnes et nommez-les comme les deux premires colonnes du fichier dentre. Dans cet exemple : username et age. Si vous avez stock le schma dans le Repository, slectionnez la mtadonne correspondant la structure de votre fichier dentre. Double-cliquez sur le composant tLogRow pour afficher la vue Basic settings et paramtrer les proprits du composant de sortie. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant dentre puis paramtrez les autres options selon vos besoins. Enregistrez le Job fils puis appuyez sur la touche F6 vous assurer quil sexcute correctement. Crez le deuxime Job jouant le rle de Job parent. Cliquez et dposez les composants tFileList et tRunJob dans lespace de modlisation.

Guide de Rfrence des Composants Talend Open Studio

1591

Scnario : Excuter un Job fils

Connectez ces deux composants laide dun lien de type Iterate. Double-cliquez sur le composant tFileList pour afficher la vue Basic settings et paramtrer les proprits du composant.

Dans le champ Directory, renseignez le chemin daccs au rpertoire contenant les fichiers traiter ou cliquez sur le bouton [...] pour parcourir vos dossiers jusqu ce rpertoire. Dans cet exemple, il sagit du rpertoire tRunJob qui contient trois fichiers dlimits. Dans la liste droulante FileList Type, slectionnez loption Files. Cochez la case Use Glob Expressions as Filemask pour pouvoir utiliser des expressions rgulires dans vos masques. Cliquez sur le bouton [...] pour ajouter un masque et renseignez le filtre appliquer. Dans cet exemple, les fichiers rcuprer sont de type dlimit, le filtre choisi est *.csv. Double-cliquez sur le composant tRunJob pour afficher la vue Basic settings et paramtrer les proprits du composant.

Cliquez sur le bouton [...] ct du champ Job pour accder la bote de dialogue [Find a Job].

1592

Guide de Rfrence des Composants Talend Open Studio

Scnario : Excuter un Job fils

Slectionnez le Job fils excuter puis cliquez sur OK pour fermer la bote de dialogue. Le nom du Job slectionn apparat dans le champ Job de la vue Basic settings du tRunJob. Cliquez sur le bouton Copy Child Job Schema pour rcuprer le schma dfini dans le Job fils. Cliquez sur le bouton [+] pour ajouter une ligne de paramtres dans le champ Context Param. Cliquez dans la cellule Values puis appuyez sur Ctrl+Espace pour accder la liste des variables de contexte et slectionnez le contexte tFileList-1.CURRENT_FILEPATH. La cellule Values est automatiquement renseigne par la variable de contexte correspondante : ((String)globalMap.get(tFileList-1.CURRENT_FILEPATH)). Pour plus dinformations sur les paramtres de contexte, consultez le Guide utilisateur de Talend Open Studio. Enregistrez le Job matre puis appuyez sur la touche F6 pour lexcuter.

Le Job appel lit les donnes contenues dans les fichiers dentre comme dfini dans le schma dentre et le rsultat de ce Job est directement affich dans la console Run. Voir galement : la section intitule tLoop , la section intitule Scnario 1 : Mettre des donnes en tampon du composant tBufferOutput.

Guide de Rfrence des Composants Talend Open Studio

1593

tSetEnv

tSetEnv

Proprits du tSetEnv
Famille du composant Fonction Objectif System Le composant tSetEnv ajoute des variables lenvironnement du systme de manire temporaire, pendant lexcution du Job. Le tSetEnv permet de crer des variables et dexcuter un Job script en communicant les informations des variables nouvellement cres entre les diffrents sousJobs. Aprs lexcution du Job, ces nouvelles variables sont supprimes. Parameters Cliquez sur le bouton [+] pour ajouter les variables ncessaires au Job. name : Renseignez la syntaxe de la nouvelle variable. value : Entrez une valeur pour ce paramtre en fonction du contexte. append : Cochez cette case pour ajouter la nouvelle variable la fin. Utilisation Limitation Le tSetEnv peut tre utilis comme composant de dbut ou composant intermdiaire. n/a

Basic settings

Scnario : Modifier une variable lors de lexcution dun Job


Le scnario suivant se prsente sous la forme de deux Jobs pre et fils. Il permet grce au tSetEnv de transfrer et de modifier dans un Job fils une valeur cre dans un Job parent. Dans le cadre de ce Job, les composants tMsgBox sont utiliss pour afficher titre informatif qu'une variable est correctement applique, via une fentre pop-up. Pour modifier la valeur du Job pre en utilisant une variable cre par le tSetEnv dans le Job fils, procdez comme dcrit dans les sections suivantes :

Dposer et relier les composants


1. Crez un premier Job appel parentJob : cliquez-droit sur l'onglet Job Design du Repository, puis slectionnez Create Job. 2. A partir de la Palette, glissez-dposez un composant tSetEnv, deux composants tMsgBox et un tRunJob dans l'espace de modlisation graphique. 3. Connectez le tSetEnv un premier tMsgBox laide dun lien OnSubJobOk : cliquez-droit sur le composant de dpart, slectionnez Trigger, puis OnSubjobOk, puis cliquez sur le composant relier.

1594

Guide de Rfrence des Composants Talend Open Studio

Scnario : Modifier une variable lors de lexcution dun Job

4. Connectez le premier tMsgBox au tRunJob galement laide dun lien OnSubjobOk. 5. Connectez ensuite le tRunJob au second tMsgBox galement laide dun lien OnSubjobOk.

6. Crez maintenant le Job fils, appel SonJob. 7. A partir de la Palette, glissez-dposez un tSetEnv et untMsgBox. 8. Connectez le tSetEnv au tMsgBox l'aide d'un lien OnSubjobOk : cliquez-droit sur le composant de dpart, slectionnez Trigger, puis OnSubjobOk . Puis cliquez sur le composant relier.

Configurer les composants


Dans cet exemple, la valeur dfinie dans le Job parent est transfre au Job fils. Elle y est modifie pour prendre la valeur du Job fils et retransfre vers le Job parent. 1. Dans le Job ParentJob, slectionnez le tSetEnv puis cliquez sur longlet Component. Ajoutez une ligne de variable en cliquant sur le bouton [+] pour dfinir sa valeur initiale. Saisissez Variable_1 dans le champ Name et Parent job value dans le champ Value. 2. Slectionnez le premier tMsgBox et cliquez sur l'onglet Component. Dans le champ Message, saisissez le message qui s'affiche dans votre fentre pop-up et qui confirme que votre variable est bien prise en compte dans le Job. Par exemple : "Parent:"+System.getProperty("Variable_1") affiche la variable dfinie dans le tSetEnv (ici Parent job value).

Guide de Rfrence des Composants Talend Open Studio

1595

Scnario : Modifier une variable lors de lexcution dun Job

3. Slectionnez le second tMsgBox et cliquez sur l'onglet Component. Dans le champ Message, saisissez nouveau la ligne "Parent:"+System.getProperty("Variable_1"). Elle fait apparatre dans le Job parent la variable dfinie dans le Job fils. 4. Slectionnez le tRunJob et cliquez sur l'onglet Component. Dans le champ Job, saisissez le nom de votre Job fils, ici SonJob. Cela excute le Job fils l'excution du Job parent.

5. Double-cliquez sur le tRunJob pour ouvrir le Job fils SonJob. 6. Slectionnez le composant tSetEnv et cliquez sur l'onglet Component. Ajoutez une ligne de variable en cliquant sur le bouton [+] pour dfinir sa valeur initiale. Saisissez Variable_1 dans le champ Name et Son job value dans le champ Value. 7. Slectionnez ensuite le tMsgBox et cliquez sur l'onglet Component. Dans le champ Message, saisissez le message qui s'affiche dans votre fentre pop-up et qui confirme que votre variable est correctement prise en compte dans le Job. Par exemple, la ligne de code "Son:"+System.getProperty("Variable_1") affiche la variable dfinie dans le tSetEnv (ici Son job value).

8. Enregistrez votre Job, retournez sous le Job parent, puis appuyez sur F6 pour lexcuter.

Excuter le Job
Trois fentres pop-up s'affichent l'une aprs l'autre : Parent: Parent job value : la valeur du Job parent est Parent job value. Son: Son job value : la valeur du Job fils est Son job value. Parent: Son job value : la valeur du Job parent a t modifie par la variable dfinie dans le tSetEnv du Job fils, puis retransfre au Job parent. La valeur du Job parent est dornavant celle dfinie dans le Job fils : Son job value.

1596

Guide de Rfrence des Composants Talend Open Studio

tSSH

tSSH

Proprits du tSSH
Famille de composant Fonction Objectif Basic settings System Le composant tSSH renvoie les donnes dun ordinateur distant via le protocole Secure Shell dfini. Le tSSH permet dentrer en communication avec un serveur distant et de renvoyer les informations de scurit. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma dans cette vue, il devient automatiquement Built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent dans le Job. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement : Guide utilisateur de Talend Open Studio. Host Port User Authentication method Adresse IP. Numro du port dcoute. Informations dauthentification de lutilisateur.

Public Key/Key Pass- Slectionnez loption adquate. phrase/Private Key Si vous choisissez loption Public Key, saisissez la passphrase (phrase secrte), si ncessaire, dans le champ Key passphrase. Puis, dans le champ Private Key, saisissez la cl prive ou cliquez sur le bouton [...] ct du champ Private Key pour parcourir votre rpertoire jusqu la cl prive. Password/Password Slectionnez loption adquate. Si vous choisissez loption Password, saisissez votre mot de passe dans le champ Password.

Authentication method

Authentication method

Keyboard tive/Password

Interac- Slectionnez loption adquate. Si vous choisissez loption Keyboard Interactive, saisissez le mot de passe requis dans le champ Password.

Guide de Rfrence des Composants Talend Open Studio

1597

Proprits du tSSH

Pseudo terminal Command separator

Cochez cette case pour appeler un interprteur de commandes interactif effectuant les oprations de terminal. Saisissez le sparateur de commandes requis. Lorsque la case Pseudo terminal est coche, ce champ nest plus disponible. Saisissez la commande permettant de rcuprer linformation de lordinateur distant. Lorsque la case Pseudo terminal est coche, ce tableau devient un mulateur de terminal, et chaque ligne du tableau devient une commande.

Commands

Use timeout/timeout in Dfinit la dure avant expiration. Un message notifiant seconds lexpiration sera gnr si lactuel temps de rponse dpasse ce dlai dexpiration. Standard Output Slectionnez la destination de la sortie standard retourner La sortie peut tre retourne vers : - la console (to console) : la sortie saffiche dans la console de la vue Run. - les variables globales (to global variables) : la sortie est indique par la variable globale correspondante. - la console et les variables globales (both to console and global variable) : la sortie est indique par les deux moyens. - une sortie normale (normal) : la sortie est une sortie SSH standard. Error Output Slectionnez la destination de la sortie derreurs retourner. La sortie peut tre retourne vers : - la console (to console) : la sortie saffiche dans la console de la vue Run. - les variables globales (to global variables) : la sortie est indique par la variable globale correspondante. - la console et les variables globales (both to console and global variable) : la sortie est indique par les deux moyens. - une sortie normale (normal) : la sortie est une sortie SSH standard. Utilisation Global variables Ce composant peut tre utilis en standalone. Standard Output : Indique la sortie standard de lexcution de la commande distante. Disponible en tant que variable After. Retourne une chane de caractres. Error output : Indique la sortie derreurs de lexcution de la commande distante. Disponible en tant que variable After. Retourne une chane de caractres.

1598

Guide de Rfrence des Composants Talend Open Studio

Scnario : Accder aux informations du systme distant via SSH

Exit value : Indique le statut de sortie de la commande distante. Disponible en tant que variable After. Retourne un entier. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main. Trigger : Run if, On Component Ok, On Component Error, On Subjob Ok, On Subjob Error. Liens dentre (dun composant un autre) : Row : Main, Iterate. Trigger : Run if, On Component Ok, On Component Error, On Subjob Ok, On Subjob Error. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio. Limitation Lutilisation de ce composant est adapte pour les systmes de type Unix.

Scnario : Accder aux informations du systme distant via SSH


Le scnario suivant dcrit un Job utilisant un protocole SSH pour afficher le nom dhte du serveur distant auquel vous souhaitez vous connecter et la date actuelle de ce systme distant. Un composant tSSH est suffisant pour ce Job. Cliquez et dposez-le de la famille System de la Palette. Double-cliquez sur le tSSH et slectionnez longlet Basic settings de la vue Component.

Guide de Rfrence des Composants Talend Open Studio

1599

Scnario : Accder aux informations du systme distant via SSH

Renseignez le nom de lhte dans le champ Host auquel accder partir du SSH, ainsi que le numro du port dans le champ Port. Dans le champ User, renseignez le nom didentification de lutilisateur sur lordinateur distant. Slectionnez la mthode dauthentification dans la liste droulante Authentication method. Dans cet exemple, la mthode dauthentification utilise est Public key (cl publique). Renseignez donc le champ Private key avec votre cl prive. Dans le champ Command, saisissez la commande suivante. Dans cet exemple, saisissez hostname; date entre guillemets doubles (code Java). Cochez la case Use timeout et paramtrez la dure avant expiration 5 secondes.

Lordinateur distant renvoie le nom de lhte, ainsi que la date et lheure en cours.

1600

Guide de Rfrence des Composants Talend Open Studio

tSystem

tSystem

Proprits du tSystem
Famille de composant Fonction Objectif Basic settings System Le composant tSystem excute une ou plusieurs commande(s) systme. tSystem peut appeler dautres commandes de traitement, fonctionnant dj dans un Job plus grand. Use home directory Command Cochez cette case pour changer le nom et le chemin du rpertoire ddi. Saisissez la commande systme excuter. Notez que la syntaxe nest pas vrifie. Sous Windows, les commandes MS-DOS ne permettent pas de passer directement du dossier courant au dossier contenant le fichier excuter. Pour excuter un fichier, vous devez donc utiliser une premire commande afin de changer de dossier courant, puis une deuxime commande excutant le fichier. Standard Output et Er- Slectionnez le type de sortie auquel les donnes traites ror Output seront transfres. to console : transmet les donnes vers la console de la vue Run. to global variable : les donnes sont envoyes dans une variable de sortie lie au composant tSystem. both to console and to global variable : les donnes sont envoyes la fois vers la console de la vue Run et dans une variable de sortie lie au composant tSystem. normal : les donnes sont envoyes au composant suivant. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma dans cette vue, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent dans le Job. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers pro-

Guide de Rfrence des Composants Talend Open Studio

1601

Proprits du tSystem

jets et Job designs. Voir galement : Guide utilisateur de Talend Open Studio. Environment variables Cliquez sur le bouton [+] pour ajouter les variables denvironnement ncessaires au Job. name : Renseignez la syntaxe de la nouvelle variable. value : Entrez une valeur pour ce paramtre en fonction du contexte. Utilisation Global Variables Ce composant sert aux entreprises qui utilisent dj dautres applications quils souhaitent intgrer leur flux via Talend. Standard Output : retourne la sortie standard dun processus. Disponible comme variable After. Retourne une chane de caractres. Error Output : retourne la sortie errone dun processus. Disponible comme variable After. Retourne une chane de caractres. Exit Value : retourne un code de sortie. Disponible comme variable After. Retourne un entier : -sans derreur > le code de sortie est 0. -avec erreurs(s) > le code de sortie est 1. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Main. Trigger : OnSubjobOk, OnSubjobError, Run if. Liens dentre (dun composant un autre) : Row : Main, Reject, Iterate. Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize. Pour plus dinformations concernant les liens, consultez le Guide utilisateur Talend Open Studio. Limitation n/a

1602

Guide de Rfrence des Composants Talend Open Studio

Scnario : Echo Hello World!

Scnario : Echo Hello World!


Ce scnario est constitu dun Job deux composants permettant dafficher un message dans la console de la vue Run.

A partir de la Palette, dposez les composants tSystem et tJava dans lespace graphique. Cliquez-droit sur le composant tSystem et slectionnez un lien de type OnSubjobOk pour relier ces deux composants. Lorsque vous excutez le Job, le premier composant dclenchera le deuxime. Double-cliquez sur le composant tSystem pour afficher longlet Basic settings et configurer ses paramtres de base.

Dans le champ Command, saisissez la commande echo suivie de la chane de caractres afficher : cmd /c echo HELLO WORLD Dans le champ Standard Output, slectionnez loption to a global variable pour envoyer la sortie dans une variable globale. Laissez les autres champs par dfaut. Slectionnez ensuite le composant tJava.

Guide de Rfrence des Composants Talend Open Studio

1603

Scnario : Echo Hello World!

Saisissez la commande Java permettant dafficher la variable de sortie du tSystem dans la console : System.out.println(Hello World!); Enregistrez votre Job puis appuyez sur F6 pour lexcuter.

Le Job excute une commande echo et affiche la sortie dans la console de log de la vue Run grce la fonction println de la commande Java du composant tJava.

1604

Guide de Rfrence des Composants Talend Open Studio

Composants Talend MDM


Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille Talend MDM de la Palette de Talend Open Studio. La famille Talend MDM regroupe les composants qui lisent et crivent des donnes dans les fichiers XML du hub XML MDM.

Guide de Rfrence des Composants Talend Open Studio

tMDMBulkLoad

tMDMBulkLoad

Proprits du tMDMBulkLoad
Famille de composant Talend MDM Fonction Objectif Le composant tMDMBulkLoad crit en masse des donnes matre structures XML dans le hub MDM. Ce composant utilise le mode bulk pour crire des donnes, de faon ce que de gros lots de donnes ou des donnes trs complexes puissent tre charg(e)s rapidement sur le serveur MDM. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Si vous modifiez le schma, il redevient automatiquement built-in. Cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. XML Field URL Slectionnez le nom de la colonne dans laquelle vous souhaitez crire les donnes XML. Saisissez lURL daccs au serveur MDM.

Basic settings

Username et Password Informations dauthentification de lutilisateur du serveur MDM. Version Saisissez le nom de la Version des donnes matre laquelle vous souhaitez vous connecter, en fonction de vos droits utilisateur. Laissez ce champ vide pour afficher la Version par dfaut des donnes matre. Data model Data Container Entity Saisissez le nom du modle de donnes par rapport auquel vous souhaitez valider les donnes crire. Saisissez le nom du conteneur de donnes contenant les donnes que vous souhaitez crire. Saisissez le nom de lentit contenant les donnes que vous souhaitez effacer.

1606

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMDMBulkLoad

Validate

Cochez cette case afin de valider les donnes que vous souhaitez crire sur le serveur MDM, par rapport des rgles de validation dfinies pour le modle de donnes courant. Pour plus dinformations concernant la dfinition des rgles de validation, consultez le Guide administrateur de Talend Master Data Management. Si vous prfrez un chargement plus rapide, ne cochez pas cette case.

Generate ID

Cochez cette case pour gnrer un identifiant aux donnes crites. Si vous prfrez un chargement plus rapide, ne cochez pas cette case.

Commit size Advanced settings Connections tStatCatcher Statistics

Saisissez le nombre de lignes de chaque lot crire sur le serveur MDM. Cochez cette case pour collecter les donnes de log au niveau du composant. Liens de sortie (dun composant un autre) : Row : Main. Trigger : Run If, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError. Liens dentre (dun composant un autre) : Row : Main. Trigger : Run If, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError. Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio.

Utilisation

Ce composant ncessite toujours un flux dentre afin de structurer des donnes en XML. Si vos donnes ne sont pas encore structures XML, vous devez utiliser des composants tels que le tWriteXMLField afin de transformer ces donnes en XML. Pour plus dinformations concernant le tWriteXMLField, consultez la section intitule tWriteXMLField .

Amliorer les chargements de donnes MDM de masse


Les informations ci-dessous concernent uniquement MDM utilis avec eXist. Lanalyse XML est un processus qui consomme beaucoup de ressources du processeur et de mmoire et qui nest pas vraiment compatible avec des ensembles de donnes particulirement volumineux. Dans la section intitule Scnario : Charger des enregistrements dans une entit mtier , le scnario donn en exemple pour le composant tMDMBulkLoad possde des limitations parce quil ne fonctionne pas avec un ensemble de donnes trs volumineux, pour le moment au moins. Un scnario alternatif dans lequel vous pouvez traiter lensemble de donnes par itrations de chargement de masse peut tre cr comme suit :

Guide de Rfrence des Composants Talend Open Studio

1607

Proprits du tMDMBulkLoad

Dans un tel scnario, le composant tMDMBulkLoad attend des donnes XML en entre. Vous devez formater manuellement ces donnes entrantes afin de les faire correspondre au schma de lentit dfini dans MDM Studio. La plupart du temps, les donnes que vous souhaitez importer sont au format plat et vous devez les transformer en XML. Puisque lanalyse XML consomme beaucoup de mmoire, vous pouvez rgler ce problme en sparant votre fichier source en plusieurs fichiers utilisant le composant tAdvancedFileOutputXML. Pour ce faire, slectionnez loption Split output in several files dans la vue Advanced settings du composant puis configurez les lignes dans chaque fichier de sortie via une variable de contexte (context.chunkSize), par exemple.

Le schma XML que vous devez dfinir dans lditeur XML du composant doit tre une correspondance exacte de lentit mtier dfinie dans le Studio MDM. Le schma XML dans lditeur doit reprsenter un seul lment racine <root> qui contient tous les autres lments, afin que vous puissiez effectuer une boucle sur chaque lment. Le chemin daccs au fichier doit tre dfini dans un dossier temporaire. Utilisez un composant tFileList pour lire tous les fichiers XML ayant t crs. Ce composant vous permet de parallliser le processus. Connectez-le un composant tFileInputXML laide dun lien Iterate.

1608

Guide de Rfrence des Composants Talend Open Studio

Scnario : Charger des enregistrements dans une entit mtier

Pour le lien Iterate, il est recommand de configurer autant de threads quil y a de coeurs physiques votre ordinateur. Vous pouvez faire ceci en utilisant Runtime.getRuntime().availableProcessors() Le composant tFileInputXML va lire les donnes des fichiers XML que vous avez crs, en dfinissant une boucle sur les lments et en rcuprant tous les noeuds dj formats en XML. Vous devez ensuite cocher la case Get Nodes.

Enfin, vous devez configurer le composant tMDMBulkLoad comme suit :

Soyez sr davoir configur la taille de commit avec la mme valeur que celle dfinie dans le composant tAdvancedfileOutputXML, la variable de contexte context.chunkSize. Le composant tFileDelete dans ce scnario va supprimer toutes les donnes temporaires la fin du Job.

Scnario : Charger des enregistrements dans une entit mtier


Ce scnario dcrit un Job qui charge des enregistrements dans lentit mtier ProductFamily dfinie par un modle de donnes spcifique dans le hub MDM. Prrequis pour ce Job : Le conteneur de donnes Product : ce conteneur de donnes est utilis pour sparer le domaine de donnes matre des produits des autres domaines de donnes matre.

Guide de Rfrence des Composants Talend Open Studio

1609

Scnario : Charger des enregistrements dans une entit mtier

Le modle de donnes Product : ce modle de donnes est utilis pour dfinir les attributs, les rgles de validation, les droits daccs des utilisateurs et les relations des entits en rapport. Il dfinit les attributs de lentit mtier ProductFamily. Lentit mtier ProductFamily : cette entit mtier contient les attributs Id et Name, dfinis dans le modle de donnes Product. Pour plus dinformations concernant la cration dun conteneur de donnes, dun modle de donnes et dune entit mtier ainsi que de ses attributs, consultez le Guide Administrateur de Talend Master Data Management. Le Job dans ce scnario utilise trois composants.

Un tFixedFlowInput : ce composant gnre les enregistrements charger dans lentit mtier ProductFamily. Gnralement, les enregistrements charger sont volumineux et stocks dans un fichier spcifique, cependant, pour faciliter la reproduction de ce scnario, ce Job utilise un tFixedFlowInput afin de gnrer quatre exemples denregistrements. Un tWriteXMLField : ce composant transforme les donnes dentre pour leur donner une structure XML. Un tMDMBulkLoad : ce composant crit en masse les donnes dentre dans lentit mtier ProductFamily et gnre une valeur dID pour chaque donne de lenregistrement. Pour reproduire ce scnario, procdez comme suit : Dposez un tFixedFlowInput, un tWriteXMLField et un tMDMBulkLoad de la Palette dans lespace de modlisation graphique. Cliquez-droit sur le tFixedFlowInput afin douvrir son menu contextuel. Slectionnez Row > Main pour relier le tFixedFlowInput au composant suivant laide dun lien Main. Rptez lopration pour lier les autres composants. Double-cliquez sur le tFixedFlowInput afin douvrir sa vue Basic settings.

1610

Guide de Rfrence des Composants Talend Open Studio

Scnario : Charger des enregistrements dans une entit mtier

Cliquez sur le bouton [...] ct du champ Edit schema pour ouvrir lditeur du schma.

Dans lditeur du schma, cliquez sur le bouton [+] pour ajouter une ligne. Cliquez sur la nouvelle et saisissez son nom : family. Cliquez sur OK. Dans la zone Mode de la vue Basic settings, slectionnez loption Use inline table. Sous le tableau, cliquez sur le bouton [+] quatre fois afin dajouter quatre lignes au tableau. Dans le tableau, cliquez sur chacune des lignes ajoutes et saisissez leur nom, entre guillemets : Shirts, Hats, Pets, Mugs (Chemises, chapeaux, vtements pour animaux, tasses). Double-cliquez sur le composant tWriteXMLField afin douvrir sa vue Basic settings.

Cliquez sur le bouton [...] ct du champ Edit schema afin douvrir lditeur du schma, dans lequel vous pouvez ajouter une ligne en cliquant sur le bouton [+].

Guide de Rfrence des Composants Talend Open Studio

1611

Scnario : Charger des enregistrements dans une entit mtier

Cliquez sur la nouvelle ligne, dans la partie droite de lditeur du schma et saisissez le nom de la colonne de sortie dans laquelle vous souhaitez crire le contenu XML. Dans cet exemple, saisissez xmlRecord. Cliquez sur OK pour valider le schma de sortie et fermer lditeur du schma. Dans la bote de dialogue qui souvre, cliquez sur OK afin de propager le schma au composant suivant. Dans la vue Basic settings, cliquez sur le bouton [...] ct du champ Configure Xml Tree pour ouvrir linterface permettant de crer la structure XML.

Dans la zone Link Target, cliquez sur rootTag et renommez le champ ProductFamily, qui est le nom de lentit mtier utilise dans ce scnario. De la zone Linker source, glissez-dposez family dans ProductFamily, dans la zone Link target. Une bote de dialogue saffiche et vous demande quel type dopration vous souhaitez effectuer. Slectionnez Create as sub-element of target node afin de crer un sous-lment du noeud ProductFamily. Llment family apparat sous le noeud ProductFamily. Dans la zone Link target, cliquez sur le noeud family et renommez-le Name, qui est lun des attributs de lentit mtier ProductFamily. Cliquez-droit sur le nud Name et slectionnez Set As Loop Element dans le menu contextuel. Cliquez sur OK afin de valider la structure XML que vous avez dfinie. Double-cliquez sur le tMDMBulkLoad afin douvrir sa vue Basic settings.

Dans la liste XML Field, slectionnez xmlRecord. Dans le champ URL, saisissez lURL du serveur MDM, entre guillemets : par exemple, http://localhost:8080/talend/TalendPort.

1612

Guide de Rfrence des Composants Talend Open Studio

Scnario : Charger des enregistrements dans une entit mtier

Dans les champs Username et Password, saisissez respectivement votre identifiant et votre mot de passe de connexion au serveur MDM. Dans les champs Data Model et Data Container, saisissez les noms correspondants au modle de donnes et au conteneur de donnes que vous souhaitez utiliser, Product pour les deux champs, dans ce scnario. Dans le champ Entity, saisissez le nom de lentit mtier dont les enregistrements doivent tre chargs. Dans cet exemple, saisissez ProductFamily. Cochez la case Generate ID afin de gnrer des valeurs dID pour les enregistrements charger. Appuyez sur F6 pour excuter le Job. Connectez-vous linterface Web de Talend Master Data Management pour vrifier les nouveaux enregistrements de lentit mtier ProductFamily.

Guide de Rfrence des Composants Talend Open Studio

1613

tMDMClose

tMDMClose

Proprits du tMDMClose
Famille de composant Talend MDM Fonction Objectif Basic settings Advanced settings Utilisation Le composant tMDMClose ferme une connexion ouverte au serveur MDM. Ce composant est utilis pour fermer un connexion ouverte au serveur MDM aprs l'excution du sous-job prcdent. Component List tStatCatcher Statistics Sil y a plus dune connexion dans le Job en cours, slectionnez le composant tMDMConnection dans la liste. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant doit tre utilis avec le tMDMConnection.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Supprimer des donnes matre d'un hub MDM .

1614

Guide de Rfrence des Composants Talend Open Studio

tMDMConnection

tMDMConnection

Proprits du tMDMConnection
Famille de composant Talend MDM Fonction Objectif Basic settings Le composant tMDMConnection ouvre une connexion au serveur MDM afin d'en permettre la rutilisation dans la transaction en cours. Ce composant est utilis pour ouvrir une connexion un serveur MDM afin de pouvoir la rutiliser dans le(s) sous-job(s) suivants. URL Saisissez l'URL pour accder au serveur MDM. Username et Password Informations dauthentification de lutilisateur du serveur MDM. Version Saisissez le nom de la Version des donnes matre auxquelles vous souhaitez vous connecter Laissez ce champ vide si vous souhaitez afficher la Version par dfaut des donnes matre. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant doit tre utilis avec les composants tMDMSP, tMDMViewSearch, tMDMInput, tMDMDelete, tMDMRouteRecord, tMDMOutput et tMDMClose.

Scnario associ
Pour un scnario associ, consultez la section intitule Scnario : Supprimer des donnes matre d'un hub MDM .

Guide de Rfrence des Composants Talend Open Studio

1615

tMDMDelete

tMDMDelete

Proprits du tMDMDelete
Famille de composant Talend MDM Fonction Objectif Basic settings Le composant tMDMDelete supprime des enregistrements de donnes dentits spcifiques du hub MDM (rfrentiel XML). Ce composant efface des donnes matre du hub MDM. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Si vous modifiez le schma, il redevient automatiquement built-in. Cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement : Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement : Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant tMDMContion nection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. URL Saisissez lURL daccs au serveur MDM. Username et Password Informations dauthentification de lutilisateur du serveur MDM. Version Saisissez le nom de la Version des donnes matre laquelle vous souhaitez vous connecter, en fonction de vos droits utilisateur. Laissez ce champ vide pour afficher la Version par dfaut des donnes matre. Entity Data Container Keys Logical delete Saisissez le nom de lentit contenant les donnes que vous souhaitez effacer. Saisissez le nom du conteneur de donnes contenant les donnes que vous souhaitez effacer. Spcifiez le(s) champ(s) (dans lordre de la squence) composant la cl lorsque lentit possde une cl multiple. Cochez cette case afin denvoyer les donnes matre dans la Corbeille, et renseignez le chemin daccs la Corbeille (Re-

1616

Guide de Rfrence des Composants Talend Open Studio

Scnario : Supprimer des donnes matre d'un hub MDM

cycle bin path). Une fois dans la Corbeille, les donnes matre peuvent tre supprimes dfinitivement ou restaures. Si vous laissez la case dcoche, les donnes matre seront supprimes dfinitivement. Die on error Cochez cette case pour passer la ligne en erreur et terminer le processus afin dobtenir des lignes ne contenant aucune erreur. Si ncessaire, vous pouvez rcuprer les lignes en erreur en utilisant un lien de type Row > Rejects. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation

tStatCatcher Statistics

Utilisez ce composant pour crire un fichier et sparer les champs laide dun sparateur spcifique.

Scnario : Supprimer des donnes matre d'un hub MDM


Ce scnario dcrit un Job a quatre composants qui supprime l'enregistrement de donnes spcifi du rfrentiel XML MDM.

Dposer et relier les composants


1. Dposez un composant tMDMConnection, un tMDMInput, un tMDMDelete et un tMDMClose de la famille Talend MDM de la Palette dans l'espace de modlisation graphique. 2. Reliez le tMDMInput au tMDMDelete l'aide d'un lien Row > Main. 3. Reliez le composant tMDMConnection au tMDMInput puis le tMDMInput au tMDMClose l'aide de liens Trigger > OnSubjobOK.

Guide de Rfrence des Composants Talend Open Studio

1617

Scnario : Supprimer des donnes matre d'un hub MDM

Configurer la connexion au serveur MDM


Dans ce scnario, un composant tMDMConnection est utilis pour ouvrir une connexion au serveur MDM et la rutiliser ultrieurement dans le sous-job suivant, qui supprime l'enregistrement de donnes spcifi. 1. Double-cliquez sur le tMDMConnection afin d'afficher sa vue Basic settings et dfinir ses proprits de base.

2. Dans le champ URL, saisissez entre guillemets l'URL du serveur MDM, par exemple : "http://localhost:8180/talend/TalendPort". 3. Dans les champs Username et Password, saisissez respectivement votre identifiant et votre mot de passe pour vous connecter au serveur MDM. 4. Dans le champ Version, saisissez entre guillemets le nom de la Version des donnes matre laquelle vous souhaitez accder. Laissez ce champ vide pour accder la Version par dfaut des donnes matre. 5. Double-cliquez sur le composant tMDMClose pour afficher sa vue Basic settings et dfinir ses proprits de base. Ce composant ferme la connexion au serveur MDM ouverte aprs l'excution russie du sous-job prcdent.

6. Dans la liste Component List, slectionnez le composant dont vous souhaitez fermer la connexion au serveur, si vous avez configur plus d'une connexion au serveur MDM. Dans ce scnario, une seule connexion est ouverte, utilisez simplement la configuration par dfaut.

Configurer la rcupration de donnes


1. Double-cliquez sur le tMDMInput pour afficher sa vue Basic settings et dfinir ses proprits de base.

1618

Guide de Rfrence des Composants Talend Open Studio

Scnario : Supprimer des donnes matre d'un hub MDM

2. Dans la liste Property Type, slectionnez Built-in afin de renseigner les champs manuellement. Si vous avez stock vos informations de connexion au serveur MDM dans le rfrentiel des mtadonnes, slectionnez Repository dans la liste et les champs seront automatiquement renseigns. 3. Dans la liste Schema, slectionnez Built-in et cliquez sur le bouton [...] ct du champ Edit schema pour ouvrir une bote de dialogue. Vous pouvez dfinir la structure des donnes matre que vous souhaitez lire dans le hub MDM.

4. Les donnes matre sont collecte dans quatre colonnes de type String : Id, Name, City et State. Cliquez sur OK pour fermer la bote de dialogue et passer l'tape suivante. 5. Cochez la case Use an existing connection et, dans la liste Component List qui apparat, slectionnez le composant que vous avez configur pour ouvrir votre connexion au serveur MDM. Dans ce scnario, une seule connexion au serveur MDM existe, utilisez donc la slection par dfaut. 6. Dans le champ Entity, saisissez entre guillemets le nom de l'entit mtier contenant les enregistrements de donnes que vous souhaitez lire. Ici, saisissez le nom de l'entit Agency.

Guide de Rfrence des Composants Talend Open Studio

1619

Scnario : Supprimer des donnes matre d'un hub MDM

7. Dans le champ Data Container, saisissez entre guillemets le nom du conteneur de donnes contenant les donnes matre que vous souhaitez lire. Dans cet exemple, utilisez le conteneur DStar. La case Use multiple conditions est coche par dfaut. 8. Dans la table Operations, dfinissez comme suit les conditions pour filtrer les donnes matre que vous souhaitez supprimer : Cliquez sur le bouton [+] pour ajouter une nouvelle ligne. Dans la colonne Xpath, saisissez entre guillemets le chemin Xpath et la balise du nud XML sur lequel appliquer le filtre. Dans cet exemple, vous travaillez avec l'entit Agency, saisissez donc Agency/Id. Dans la colonne Function, slectionnez la fonction que vous souhaitez utiliser. Dans ce scnario, utilisez la fonction Starts With. Dans la colonne Value, saisissez la valeur de votre filtre. Filtrez les donnes matre done l'ID commence par TA. 9. Dans la vue Component, cliquez sur Advanced settings afin de configurer les paramtres avancs.

10.Dans le champ Loop XPath query, saisissez entre guillemets la structure et le nom du nud XML sur lequel la boucle doit tre effectue. 11.Dans la table Mapping et dans la colonne XPath query, saisissez entre guillemets le nom de la balise XML dans laquelle vous souhaitez collecter les donnes matre, ct du nom de la colonne de sortie correspondante.

Configurer la suppression de l'enregistrement de donnes


1. Dans l'espace de modlisation graphique, double-cliquez sur le composant tMDMDelete afin d'afficher sa vue Basic settings et dfinir ses proprits de base.

1620

Guide de Rfrence des Composants Talend Open Studio

Scnario : Supprimer des donnes matre d'un hub MDM

2. Dans la liste Schema, slectionnez Built-in puis cliquez sur le bouton [...] ct du champ Edit Schema afin de dcrire la structure des donnes matre dans le hub MDM.

3. Cliquez sur le bouton [+] de droite afin d'ajouter une colonne de type String. Nommez cette colonne outputXML. Cliquez sur OK pour fermer la bote de dialogue et passer l'tape suivante. 4. Cochez la case Use an existing connection, puis, dans la liste Component List qui apparat, slectionnez le composant que vous avez configur pour ouvrir votre connexion au serveur MDM. Dans ce scnario, une seule connexion au serveur MDM existe, utilisez la slection par dfaut. 5. Dans le champ Entity, saisissez le nom de l'entit mtier contenant les donnes matre que vous souhaitez supprimer, l'entit Agency dans cet exemple. 6. Dans le champ Data Container, saisissez le nom du conteneur de donnes contenant les donnes supprimer, DStar dans cet exemple.

Guide de Rfrence des Composants Talend Open Studio

1621

Scnario : Supprimer des donnes matre d'un hub MDM

7. Dans le tableau Keys, cliquez sur le bouton [+] pour ajouter une nouvelle ligne. Dans la colonne Keys, slectionnez la colonne contenant la cl de l'entit Agency. Dans ce scnario, la cl de l'entit Agency est dfinie dans le champ Id. Si l'entit possde plusieurs cls, ajoutez autant de ligne que ncessaire pour les cls et slectionnez-les en ordre squentiel. 8. Cochez la case Logical delete si vous ne souhaitez pas supprimer les donnes matre de manire permanente. Cela envoie les donnes supprimes dans la corbeille. Une fois dans la corbeille, les donnes matre peuvent tre restaures ou supprimes dfinitivement. Si vous laissez la case dcoche, les donnes matre seront supprimes dfinitivement. 9. Renseignez le champ Recycle bin path. Laissez le chemin d'accs par dfaut, sauf si le chemin d'accs votre corbeille est diffrent de celui par dfaut. Dans ce cas, saisissez le chemin d'accs votre corbeille.

Sauvegarder et excuter le Job


1. Appuyez sur les touches Ctrl+S afin de sauvegarder votre Job et vous assurer que tous les paramtres configurs seront pris en compte. 2. Appuyez sur F6 pour excuter votre Job. Les donnes matre dont l'ID commence par "TA" ont t supprimes et envoyes dans la corbeille.

1622

Guide de Rfrence des Composants Talend Open Studio

tMDMInput

tMDMInput

Proprits du tMDMInput
Famille de composant Talend MDM Fonction Objectif Basic settings Le composant tMDMInput lit les donnes matre du hub MDM (rfrentiel XML). Ce composant lit les donnes matre dans un hub MDM et rend possible le traitement de ces donnes. Property Type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement builtin. Si vous modifiez le schma, il redevient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant tMDMContion nection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. URL Saisissez lURL daccs au serveur MDM. Username et Password Saisissez les informations dauthentification de lutilisateur du serveur MDM. Version Saisissez le nom de la Version des donnes matre laquelle vous souhaitez vous connecter, en fonction de vos droits utilisateur. Laissez ce champ vide pour afficher la Version par dfaut des donnes matre. Entity Data Container Saisissez le nom de lentit contenant les donnes que vous souhaitez effacer. Saisissez le nom du conteneur de donnes contenant les donnes que vous souhaitez effacer.

Guide de Rfrence des Composants Talend Open Studio

1623

Scnario : Lire les donnes matre dun hub MDM

Use multiple conditions Cochez cette case pour filtrer les donnes matre laide de conditions. Xpath : saisissez, entre guillemets, le nud XML sur lequel appliquer la condition. Function : slectionnez la condition utiliser. Value : saisissez, entre guillemets, la valeur souhaite. Predicate : slectionnez un prdicat lorsque vous utilisez plusieurs conditions. Si vous dcochez cette case, vous avez la possibilit de slectionner des ID particuliers devant tre affichs dans la colonne ID value du tableau IDS. Si vous dcochez la case Use multiple conditions, loption Batch Size de longlet Advanced settings ne sera plus disponible. Skip rows Limit Die on error Renseignez le nombre de lignes ignorer. Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ou traite. Cochez cette case pour passer la ligne en erreur et terminer le processus afin dobtenir des lignes ne contenant aucune erreur. Si ncessaire, vous pouvez rcuprer les lignes en erreur en utilisant un lien de type Row > Rejects. Nombre de lignes dans chaque lot trait. Cette option napparat pas si vous avez dcoch la case Use multiple conditions dans longlet Basic settings. Loop XPath query Mapping Nud de larborescence XML sur lequel est base la boucle. Column : reflte le schma tel quil est dfini dans lditeur Edit Schema. XPath query : Saisissez les champs extraire de la structure XML dentre. Get Nodes : Cochez cette case pour rcuprer les balises XML entourant les donnes avec celles-ci. tStatCatcher Statistics Utilisation Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings

Batch Size

Ce composant est utilis comme composant de dbut. Il ncessite un flux de sortie.

Scnario : Lire les donnes matre dun hub MDM


Ce scnario dcrit un Job deux composants qui lit les donnes matre dans un serveur MDM et les affiche dans la console de log.

1624

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lire les donnes matre dun hub MDM

A partir de la Palette, glissez les composants tMDMInput de la famille Talend MDM et tLogRow de la famille Logs & Errors dans lespace de modlisation. Reliez-les via un lien de type Row Main. Double-cliquez sur le composant tMDMInput pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits.

Dans la liste Property Type, slectionnez Built-In et renseignez les champs manuellement. Si vous avez stock les informations de connexion au MDM dans les mtadonnes du Repository, slectionnez Repository dans la liste et les champs suivants seront renseigns automatiquement. Dans la liste Schema, slectionnez Built-In et cliquez sur le bouton [...] ct du champ Edit schema pour dcrire la structure des donnes matre que vous souhaitez lire sur le serveur MDM.

Les donnes matre sont rcupres dans un schma trois colonnes de type String : ISO2Code, Name, Currency. Cliquez sur OK. Dans le champ URL, saisissez entre guillemets lURL de connexion au serveur MDM.

Guide de Rfrence des Composants Talend Open Studio

1625

Scnario : Lire les donnes matre dun hub MDM

Dans les champs Username et Password, saisissez lidentifiant et le mot de passe de connexion au serveur MDM. Dans le champ Version, saisissez entre guillemets le nom de la Version des donnes matre laquelle vous avez souhaitez accder. Laissez le champ vide pour afficher la Version par dfaut. Dans le champ Entity, saisissez entre guillemets le nom de lentit mtier contenant les donnes matre que vous souhaitez lire. Dans le champ Data Container, saisissez entre guillemets le nom du conteneur de donnes contenant les donnes matre que vous souhaitez lire. Dans la vue Component, cliquez sur longlet Advanced settings pour paramtrer les proprits avances du composant.

Dans le champ Loop XPath query, saisissez entre guillemets larborescence et le nom du nud XML sur lequel effectuer la boucle. Dans le tableau Mapping, les colonnes du schma du composant apparaissent sous la colonne Column. Saisissez entre guillemets le nom de la balise XML dans laquelle rcuprer les donnes matre dans le champ XPath query correspondant la colonne du schma de sortie. Dans lespace de modlisation, double-cliquez sur le composant tLogRow pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits. Cliquez sur Edit schema et assurez-vous que le schma est rcupr du composant prcdent. Sinon, cliquez sur Sync Columns pour rcuprer le schma du composant. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

1626

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lire les donnes matre dun hub MDM

La liste des diffrents pays, ainsi que leur code et devise est retourne dans la console de la vue Run.

Guide de Rfrence des Composants Talend Open Studio

1627

tMDMOutput

tMDMOutput

Proprits du tMDMOutput
Famille de composant Talend MDM Fonction Objectif Basic settings Le composant tMDMOutput crit des donnes matre dans un hub MDM (rfrentiel XML). Ce composant crit des donnes matre sur le serveur MDM. Property Type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema et Edit schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il devient automatiquement builtin. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. XML Field Slectionnez le nom de la colonne dans laquelle vous souhaitez crire les donnes XML.

Use an existing connec- Cochez cette case et slectionnez le composant tMDMContion nection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. URL Saisissez lURL daccs au serveur MDM. Username et Password Saisissez les informations dauthentification de lutilisateur du serveur MDM. Cet utilisateur doit avoir le bon rle dans MDM, cest--dire quil puisse se connecter via un Job ou tout autre appel de service Web. Pour plus dinformations, consultez le Guide administrateur de Talend Master Data Management. Version Saisissez le nom de la Version des donnes matre laquelle vous souhaitez vous connecter, en fonction de vos droits utilisateur.

1628

Guide de Rfrence des Composants Talend Open Studio

Proprits du tMDMOutput

Laissez ce champ vide pour afficher la Version par dfaut des donnes matre. Data Model Data Container Return Keys Saisissez le nom du modle de donnes en comparaison duquel les donnes crire seront valides. Saisissez le nom du conteneur de donnes dans lequel vous souhaitez crire les donnes matre. Columns corresponding to IDs in order : dans lordre squentiel, dfinissez les colonnes de sortie qui stockeront les valeurs des cls retournes (cls primaires) des lments crer. Cochez cette case pour mettre jour les champs modifis. Si vous ne cochez pas cette case, la totalit des champs sera remplace par les champs modifis. Fire event Create/Update Cochez cette case pour ajouter les actions effectues un rapport de modifications. Source Name : Saisissez, entre guillemets, le nom de lapplication partir de laquelle les modifications sont apportes. Enable verification by before saving transformer : Cochez cette case pour vrifier lenregistrement qui vient dtre ajout avant quil ne soit enregistr. Use partial update Cochez cette case si vous devez mettre jour des lments multi-occurences (attributs) dune entit existante partir du contenu dun flux XML dentre. Une fois la case coche, vous devez configurer les paramtres ci-dessous : - Pivot : saisissez le chemin XPath vers les sous-lments multi-occurences dans lesquels des donnes doivent tre ajoutes ou remplaces dans lentit de votre choix. Par exemple, vous souhaitez ajouter un sous-lment fils une entit existante, comme suit : <Person> <Id>1</Id> <Addresses> <Address> <Type>office</Type> (...address elements are here....) </Address> <Address> <Type>home</Type> (...address elements are here....) </Address> <Addresses> </Person> le chemin XPath saisi dans le champ Pivot doit tre comme suit : Person/Children/Child

Is Update

Guide de Rfrence des Composants Talend Open Studio

1629

Proprits du tMDMOutput

et la case Overwrite devrait tre dslectionne. Et, si vous devez remplacer un sous-lment fils dans une entit existante : <Person> <Id>1</Id> <Addresses> <Address> <Type>office</Type> (...address elements are here....) </Address> <Address> <Type>home</Type> (...address elements are here....) </Address> <Addresses> </Person> le chemin XPath saisi dans le champ Pivot doit tre comme suit : Person/Addresses/Adress la case Overwrite doit tre coche et la champ Key configur comme suit : Person/Addresses/Address/Type. Dans cet exemple, nous supposons que lentit MDM a seulement une adresse de type office, ainsi cette adresse de type office sera remplace et ladresse de type home sera ajoute. - Overwrite : cochez cette case si vous devez remplacer ou mettre jour les sous-lments originaux par les sous-lments dentre. Laissez cette case dcoche si vous souhaitez ajouter un sous-lment. - Key : saisissez le chemin XPath relatif au pivot qui permettra de mettre en correspondance le sous-lment du flux XML dentre avec le sous-lment de lentit. Si une cl nest pas fournie, tous les sous-lments de lentit ayant un XPath qui correspond celui du sous-lment du flux XML dentre seront remplacs. -Position : saisissez un chiffre pour indiquer la position aprs laquelle les nouveaux lments (ceux qui ne correspondent pas la cl) seront ajout. Si vous ne renseignez pas ce champ, les nouveau lments seront ajouts la fin. Die on error Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Rejects. Cochez cette case pour commiter les donnes matre par lot. Rows to commit : saisissez le nombre de lignes par lot.

Advanced settings

Extended Output

1630

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes matre dans un hub MDM

Configure Xml Tree Group by

Ouvrez linterface daide la cration de la structure XML des donnes matre crire. Slectionnez la colonne utiliser pour regrouper les donnes matre.

Create empty element if Cette case est coche par dfaut. Si le contenu de la colonne needed Related Column de linterface permettant de crer la structure XML est nul, ou si aucune colonne nest associe au nud XML, cette option crera une balise ouvrante et une balise fermante aux endroits prvus. Advanced separator (for Cochez cette case pour modifier les sparateurs utiliss par number) dfaut dans les nombres : - Thousands separator : saisissez entre guillemets le sparateur utiliser pour les milliers. - Decimal separator : saisissez entre guillemets le sparateur utiliser pour les dcimales. Generation mode Slectionnez le mode de gnration que vous souhaitez utiliser en fonction de votre mmoire disponible : - Fast but memory-consuming (Dom4J), le plus rapide mais consommant de la mmoire. - Slow with no memory consumed, le plus lent ne consommant pas de mmoire. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

tStatCatcher Statistics Utilisation

Utilisez ce composant pour crire un fichier et sparer les champs laide dun sparateur spcifque.

Scnario : Ecrire des donnes matre dans un hub MDM


Ce scnario dcrit un Job deux composants qui gnre un enregistrement de donnes, transforme ces donnes en XML et les charge dans lentit mtier dfinie sur le serveur MDM .

Dans cet exemple, lobjectif est de charger une nouvelle agence dans lentit mtier Agency. Cette nouvelle agence doit comprendre un identifiant, un nom et une ville. A partir de la Palette, glissez les composants tFixedFlowInput de la famille Misc, et tMDMOutput de la famille Talend MDM dans lespace de modlisation. Reliez-les via un lien de type Row > Main.

Guide de Rfrence des Composants Talend Open Studio

1631

Scnario : Ecrire des donnes matre dans un hub MDM

Double-cliquez sur le composant tFixedFlowInput pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits.

Dans la liste Schema, slectionnez Built-In et cliquez sur le bouton [...] ct du champ Edit schema pour dcrire la structure des donnes matre que vous souhaitez crire dans le serveur MDM.

Ajoutez trois colonnes de type String en cliquant sur le bouton [+]. Nommez ces colonnes Id, Name et City. Cliquez sur OKpour valider vos modifications et passer ltape suivante. Dans le champ Number of rows, saisissez le nombre de lignes que vous souhaitez gnrer. Dans la zone Mode, slectionnez le mode Use Single Table pour ne gnrer quune seule table. Dans le tableau Values, saisissez entre guillemets, dans chaque champ Value, la valeur correspondant chaque colonne du schma. Dans lespace de modlisation, double-cliquez sur le composant tMDMOutput pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits.

1632

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes matre dans un hub MDM

Dans la liste Property Type, slectionnez Built-In et renseignez les champs manuellement. Si vous avez stock les informations de connexion au MDM dans les mtadonnes du Repository, slectionnez Repository dans la liste et les champs suivants seront renseigns automatiquement. Dans la liste Schema, slectionnez Built-In et cliquez sur le bouton [...] ct du champ Edit schema pour dcrire la structure des donnes matre que vous souhaitez charger sur le serveur MDM.

Le composant tMDMOutput gnre un document XML, lcrit dans un champ de sortie et lenvoie au serveur MDM, afin que le schma de sortie ait toujours une colonne xml en lecture seule. Cliquez sur OK pour passer ltape suivante. La liste XML Field dans longlet Basic settings est automatiquement renseigne avec la colonne xml de sortie que vous venez de crer. Dans le champ URL, saisissez entre guillemets lURL de connexion au serveur MDM. Dans les champs Username et Password, saisissez lidentifiant et le mot de passe de connexion au serveur MDM.

Guide de Rfrence des Composants Talend Open Studio

1633

Scnario : Ecrire des donnes matre dans un hub MDM

Dans le champ Version, saisissez entre guillemets le nom de la Version des donnes matre laquelle vous souhaitez accder. Laissez le champ vide pour accder la Version par dfaut. Dans le champ Data Model, saisissez entre guillemets le nom du modle de donnes par rapport auquel vous souhaitez valider les donnes matre que vous souhaitez crire. Dans le champ Data Container, saisissez entre guillemets le nom du conteneur de donnes dans lequel les donnes matre doivent tre crites. Dans la vue Component, cliquez sur longlet Advanced settings pour paramtrer les paramtres avancs du composant.

Cochez la case Extended Output si vous souhaitez commiter les donnes matre par lot. Vous pouvez spcifier le nombre de lignes par lot dans le champ Rows to commit. Cliquez sur le bouton [...] du champ Configure Xml Tree pour ouvrir lditeur du composant.

Dans la zone Link target droite, cliquez dans le champ Xml Tree et remplacez rootTag par le nom de lentit mtier dans laquelle vous souhaitez insrer lenregistrement de donnes, Agency dans cet exemple. Dans la zone Linker source, slectionnez les trois colonnes de votre schma et glissez les sur le nud Agency. La bote de dialogue [Selection] souvre.

1634

Guide de Rfrence des Composants Talend Open Studio

Scnario : Ecrire des donnes matre dans un hub MDM

Slectionnez Create as sub-element of target node pour que vos trois colonnes correspondent trois souslments du noeud Agency en XML. Cliquez sur OK.

Dans la zone Link target cliquez-droit sur llment que vous souhaitez dfinir comme lment sur lequel effectuer une boucle, puis slectionnez Set as Loop Element dans le menu contextuel. Dans cet exemple, City est llment ditration. Cliquez sur OK pour valider vos changements et fermer lditeur. Enregistrez votre Job et appuyez sur F6 pour lexcuter. Le nouvel enregistrement de donnes est insr dans lentit mtier Agency, dans le conteneur de donnes DStar, sur le serveur MDM. Cet enregistrement de donnes contient, comme dfini dans le schma, lID de lagence, son nom et sa ville. La cl primaire de lenregistrement insr est galement gnre et retrouve.

Guide de Rfrence des Composants Talend Open Studio

1635

Scnario : Ecrire des donnes matre dans un hub MDM

1636

Guide de Rfrence des Composants Talend Open Studio

tMDMReceive

tMDMReceive

Proprits du tMDMReceive
Famille de composant Talend MDM Fonction Objectif Basic settings Le composant tMDMReceive reoit un enregistrement MDM provenant de dclencheurs MDM ou de processus MDM. Ce composant dcode un paramtre de contexte comprenant des donnes MDM XML et les transforme en schma plat. Property Type Peut tre Built-in ou Repository. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il passe automatiquement en mode Built-In. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. XML Record Saisissez le paramtre de contexte vous permettant de rcuprer les dernires modifications apportes au serveur MDM. Pour plus dinformations propos de la cration et de lutilisation des paramtres de contexte, consultez le Guide Utilisateur de Talend Open Studio. Si ncessaire, slectionnez dans la liste lexpression XPath de boucle, qui est la concatnation du prfixe et du chemin de la boucle. /item : slectionnez ce prfixe XPath lorsque le composant reoit lenregistrement dun processus, car les processus encapsulent lenregistrement dans un lment item uniquement. /exchange/item : slectionnez ce prfixe XPath lorsque le composant reoit lenregistrement dun dclencheur, car les dclencheurs encapsulent lenregistrement dans un lment item dans un lment exchange. Loop XPath query Mapping Nud de larborescence XML sur lequel est base la boucle. Column : reflte le schma tel quil est dfini dans lditeur Edit Schema.

XPath Prefix

Guide de Rfrence des Composants Talend Open Studio

1637

Scnario associ

XPath query : Saisissez les champs extraire de la structure XML dentre. Get Nodes : Cochez cette case pour ajouter les balises XML entourant les donnes rcuprer. Limit Die on error Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ni traite. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject. Cochez cette case pour collecter les donnes de log au niveau du composant.

Advanced settings Utilisation

tStatCatcher Statistics

Ce composant est un composant de sortie. Il ncessite un flux de sortie.

Scnario associ
Aucun scnario nest disponible pour ce composant.

1638

Guide de Rfrence des Composants Talend Open Studio

tMDMRouteRecord

tMDMRouteRecord

Proprits du tMDMRouteRecord
Famille de composant Talend MDM Fonction Le composant tMDMRouteRecord soumet la cl primaire dun enregistrement stock dans votre hub MDM (Repository) lEvent Manager, afin que ce gestionnaire dclenche le ou les processus attendu(s) selon certaines conditions que vous devez dfinir dans les pages des processus et des dclencheurs. Pour plus dinformations concernant lEvent Manager et les processus MDM, consultez le Guide Administrateur de Talend Master Data Management. Ce composant permet lEvent Manager didentifier les modifications apportes vos donnes, pour que les actions corrles puissent tre dclenches. Use an existing connec- Cochez cette case et slectionnez le composant tMDMContion nection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. URL Saisissez lURL daccs au serveur MDM. Username et Password Informations dauthentification de lutilisateur du serveur MDM. Version Saisissez le nom de la Version des donnes matre laquelle vous souhaitez vous connecter, en fonction de vos droits utilisateur. Laissez ce champ vide pour afficher la Version par dfaut des donnes matre. Entity Data Container Entity Name IDS Advanced settings Global Variables tStatCatcher Statistics Saisissez le nom de lentit contenant les donnes que vous souhaitez effacer. Saisissez le nom du conteneur de donnes contenant les donnes que vous souhaitez effacer. Saisissez le nom de lentit mtier contenant lenregistrement que vous souhaitez faire lire lEvent Manager. Spcifiez la (les) cl(s) primaire(s) de(s) lenregistrement(s) que vous souhaitez faire lire lEvent Manager. Cochez cette case pour collecter les donnes de log au niveau du composant. Number of Lines : indique le nombre de lignes traites. Disponible en tant que variable After. Retourne un entier. Pour plus dinformations concernant les variables, consultez le Guide Utilisateur de Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Iterate.

Objectif Basic settings

Guide de Rfrence des Composants Talend Open Studio

1639

Scnario : Router un enregistrement vers lEvent Manager

Trigger : Run If, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError. Liens dentre (dun composant un autre) : Row : Iterate. Trigger : Run If, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError. Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur de Talend Open Studio. Utilisation Ce composant est un composant de dbut. Il ncessite un flux de sortie.

Scnario : Router un enregistrement vers lEvent Manager


Dans ce scnario, le composant tMDMRouteRecord est utilis pour soumettre lEvent Manager la cl primaire dun enregistrement notifiant une mise jour, afin que lEvent Manager dclenche un processus informant lutilisateur de la mise jour effectue. Talend MDM est sensible la casse, respectez donc les majuscules et les minuscules lorsque vous ralisez ce scnario.

Prrequis du scnario
Les prrequis pour la ralisation de ce scnario sont les suivants : Un conteneur de donnes contenant diffrents enregistrements utilisant un modle spcifique. Dans ce scnario, le conteneur de donnes est Product, et un enregistrement est inclus dans le conteneur, en suivant le modle nomm Product :

1640

Guide de Rfrence des Composants Talend Open Studio

Scnario : Router un enregistrement vers lEvent Manager

Cette capture dcran prsente lun des enregistrements produit stocks avec tous les attributs que vous pouvez voir. Pour plus dinformations concernant la cration dun conteneur de donnes ou dun modle de donnes, consultez le Guide Administrateur de Talend Master Data Management. Pour plus dinformations concernant la cration dun enregistrement et laccs ses attributs, consultez le Guide Utilisateur de Talend MDM Web User Interface. Un Job, utilis pour informer lutilisateur de la mise jour, dj dploy sur votre serveur MDM. Dans ce scnario, le Job est appel message, il nutilise que le composant tMsgBox. Double-cliquez sur le composant afin dafficher et de configurer ses Basic settings :

Dans le champ Title, saisissez Talend MDM. Dans le champ Message, saisissez le message qui apparatra : A record is updated. Pour plus dinformations concernant le composant tMsgBox, consultez la section intitule tMsgBox . Pour plus dinformations sur comment dployer un Job sur le serveur MDM, consultez le Guide Administrateur de Talend Master Data Management.

Guide de Rfrence des Composants Talend Open Studio

1641

Scnario : Router un enregistrement vers lEvent Manager

Router un enregistrement afin de dclencher le processus correspondant


Ce scnario vous explique comment dclencher un processus laide dun composant tMDMRouteRecord. Connectez-vous linterface Web Talend MDM et cliquez sur Browse Records. Pour plus dinformations concernant la connexion linterface Web Talend MDM et louverture de la vue Browse Records, consultez le Guide Utilisateur de Talend MDM Web User Interface. Dans le coin suprieur droit de la page Web, cliquez sur le bouton afin dafficher le panneau Actions.

Dans le panneau Actions de droite, slectionnez le conteneur de donnes requis, ainsi que le modle de donnes contenant le fichier mettre jour. Dans ce scnario, le conteneur de donnes et le modle de donnes sont tous les deux appels Product. Cliquez sur Save afin de sauvegarder le conteneur et le modle de donnes slectionns. Dans la vue Browse Records, slectionnez lentit souhaite. Dans cet exemple, slectionnez Product.

Cliquez sur Search pour ouvrir la liste des enregistrements dans la partie infrieure de la page Web.

Double-cliquez sur lun des enregistrements produit afin dafficher ses attributs dans une nouvelle vue ddie ce produit. Par exemple, ouvrez le produit Talend Mug ayant lId unique 231035938.

1642

Guide de Rfrence des Composants Talend Open Studio

Scnario : Router un enregistrement vers lEvent Manager

Dans cette vue, modifiez la valeur de lun des attributs. Par exemple, mettez jour ce produit. Rendez-le disponible en cochant la case Availability. Cliquez sur Save afin de valider la mise jour. Ouvrez votre Studio Talend MDM et accdez au hub MDM (vue MDM Server). Pour plus dinformations concernant le lancement du Studio Talend MDM et sa connexion au hub MDM, consultez le Guide Administrateur de Talend Master Data Management.

Sous le noeud Job Repository de la vue MDM Server, cliquez-droit sur le Job message. Dans le menu contextuel, slectionnez Generate Talend Job Caller Process. Le processus utilis pour appeler ce Job est gnr et saffiche dans le rpertoire Event Management > Process.

Guide de Rfrence des Composants Talend Open Studio

1643

Scnario : Router un enregistrement vers lEvent Manager

Sous le noeud Event Management, cliquez-droit sur Trigger. Dans le menu contextuel, slectionnez New. Dans lassistant New Trigger, nommez le dclencheur TriggerMessage.

Cliquez sur OK afin douvrir la vue du nouveau dclencheur dans lespace de travail de votre studio. Dans la vue du dclencheur, configurez le dclencheur afin quil lance le processus appelant le Job message une fois la mise jour effectue.

1644

Guide de Rfrence des Composants Talend Open Studio

Scnario : Router un enregistrement vers lEvent Manager

Dans le champ Description, saisissez Trigger that calls the Talend Job: message_0.1.war. Dans le champ Entity, slectionnez lentit mtier sur laquelle vous souhaitez dclencher le processus, ou saisissez son nom. Dans cet exemple, son nom est Update. Dans le champ Service JNDI Name, slectionnez callprocess dans la liste droulante. Dans le champ Service Parameters, compltez la dfinition des paramtres en saisissant la valeur : CallJob_message_0.1.war. Cette valeur est le nom du processus appeler, que vous pouvez trouver dans le dossier Event Management > Process dans la vue MDM server. Dans la zone Trigger xPath Expressions, cliquez sur le bouton XPath. sous le tableau, afin dajouter une ligne

Dans la ligne nouvellement ajoute, cliquez sur le bouton [...] pour ouvrir une bote de dialogue dans laquelle vous pouvez slectionner lentit ou llment sur laquelle/lequel vous souhaitez dfinir des conditions. Dans cet exemple, son nom est Update/OperationType.

Guide de Rfrence des Composants Talend Open Studio

1645

Scnario : Router un enregistrement vers lEvent Manager

Dans la colonne Value, saisissez une valeur pour cette ligne. Dans cet exemple, la valeur est UPDATE. Dans la colonne Condition Id, saisissez un identifiant unique pour la condition que vous souhaitez dfinir, par exemple C1. Dans la zone Conditions, saisissez la requte que vous souhaitez excuter sur les donnes en utilisant lID de la condition ID C1 dfini plus tt. Appuyez sur Ctrl+S pour sauvegarder le dclencheur. Dans la vue MDM server, double-cliquez sur Data container > system > UpdateReport pour ouvrir la vue Data Container Browser UpdateReport. Le rapport UpdateReport contient les traces compltes de toutes les actions de cration, de mise jour ou de suppression (Create, Update ou Delete) effectues sur les donnes matre.

A ct du champ Entity de cette vue, cliquez sur le bouton pour rechercher tous les enregistrements concernant les actions dans le rapport UpdateReport. Notez que lentit Update ne signifie pas ncessairement que laction enregistre est une mise jour, cest simplement le nom de lentit dfinie par le modle de donnes du rapport UpdateReport pouvant contenir diffrentes actions comme create, delete, et update. Le dernier enregistrement correspond aux modifications apportes lenregistrement produit au dbut du scnario. La cl primaire de cet enregistrement est genericUI.1283244014172. Cet enregistrement sera rout vers lEvent trigger.

1646

Guide de Rfrence des Composants Talend Open Studio

Scnario : Router un enregistrement vers lEvent Manager

Dans la barre de menu du studio, cliquez sur Window > Perspective > Data Integration afin de crer le Job routant lenregistrement. Dans la perspective Data Integration, crez un Job et nommez-le RouteRecord. Pour ce faire, cliquez-droit sur Job Designs, dans la vue Repository. Dans le menu contextuel, slectionnez Create Job. Un assistant souvre. Dans le champ Name, saisissez RouteRecord, puis cliquez sur Finish. Dposez le composant tMDMRouteRecord de la Palette dans lespace de modlisation graphique. Double-cliquez sur ce composant afin douvrir sa vue Component.

Dans le champ URL, saisissez ladresse de votre serveur MDM, http://localhost:8080/talend/TalendPort, dans cet exemple. Dans les champs Username et Password, saisissez respectivement votre identifiant et votre mot de passe de connexion. Dans le champ Data Container saisissez le nom du conteneur de donnes contenant lenregistrement que vous souhaitez router vers lEvent Manager. Dans cet exemple, son nom est UpdateReport. Dans le champ Entity Name, saisissez le nom de lentit laquelle appartient lenregistrement que vous souhaitez router. Dans cet exemple, son nom est Update. Dans la zone IDS, cliquez sur le bouton [+] sous le tableau, afin dajouter une ligne. Dans cette nouvelle ligne, renseignez la cl primaire de lenregistrement devant tre rout vers lEvent manager, cest--dire genericUI.1283244014172, comme vous lavez vu dans le rapport Data Container Browser UpdateReport. Appuyez sur F6 pour excuter le Job. LEvent manager appelle le processus devant excuter le Job message et gnrer la bote de dialogue informant lutilisateur de la mise jour effectue.

Guide de Rfrence des Composants Talend Open Studio

1647

Scnario : Router un enregistrement vers lEvent Manager

Le composant tMDMRouteRecord est utilis pour soumettre lEvent Manager la cl primaire dun enregistrement notifiant une mise jour. LEvent Manager analyse le fichier et vrifie que les conditions dfinies dans la vue de configuration du dclencheur Triggers message sont remplies, puis appelle le processus lanant le Job Message. Ce Job informe lutilisateur de la mise jour effectue en faisant apparatre une fentre pop-up.

1648

Guide de Rfrence des Composants Talend Open Studio

tMDMSP

tMDMSP

Proprits du tMDMSP
Famille de composant Fonction Objectif Basic settings Talend MDM Le composant tMDMSP appelle une procdure stocke du hub MDM. tMDMSP permet de centraliser des requtes multiples ou complexes dans une base de donnes et de les appeler plus facilement. Schema et Edit Schema Dans une procdure stocke, le schma est un paramtre dentre. Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement leGuide Utilisateur de Talend Open Studio. Use an existing connec- Cochez cette case et slectionnez le composant tMDMtion Connection adquat partir de la liste Component pour rutiliser les paramtres dune connexion que vous avez dj dfinie. URL Saisissez lURL du serveur MDM. Username et Password Informations dauthentification sur lutilisateur de base de donnes. Version Saisissez le nom de la Version des donnes matre laquelle vous souhaitez vous connecter, en fonction de vos droits utilisateur. Laissez ce champ vide pour afficher la Version par dfaut des donnes matre. Data Container SP Name Parameters (in order) Saisissez le nom du conteneur de donnes contenant les donnes que vous souhaitez effacer. Saisissez le nom exact de la Procdure Stocke. Cliquez sur le bouton [+] et slectionnez les colonnes dentre (Input Columns) requises pour les procdures. Le schma SP peut contenir plus de colonnes quil ny a de paramtres utiliss dans la procdure. Connections Liens de sortie (dun composant lautre) : Row : Main

Guide de Rfrence des Composants Talend Open Studio

1649

Scnario : Excuter une procdure stocke dans le hub MDM

Trigger : Run if, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError. Liens dentre (dun composant lautre) : Row : Main, Iterate; Trigger : Run if, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError Pour plus dinformations concernant les connexions, consultez le Guide utilisateur Talend Open Studio. Utilisation Limitation Ce composant est un composant intermdiaire. Il peut tre utilis comme composant de dbut mais aucun paramtre dentre nest requis pour la procdure appeler. N/A

Scnario : Excuter une procdure stocke dans le hub MDM


Le but du Job suivant est de calculer le prix total de chaque produit enregistr dans votre interface Web MDM.

Ce Job va gnrer des paramtres pour lexcution dune procdure stocke dans le hub MDM, puis extraire les donnes souhaites du rsultat retourn au format XML et prsenter les donnes extraites dans le studio. Les produits dont le prix est traiter sont lists dans votre interface Web MDM.

1650

Guide de Rfrence des Composants Talend Open Studio

Scnario : Excuter une procdure stocke dans le hub MDM

La procdure stocke devant tre excute peut tre trouve dans le nud Stored Procedure de larborescence MDM Server et apparat comme suit :

Pour plus dinformations concernant la procdure stocke dans le serveur MDM, consultez le Guide Administrateur de Talend Master Data Management. Pour crer ce Job, procdez comme suit : Glissez-dposez les composants suivants utiliss dans cet exemple : tFixedFlowInput, tMDMSP, tExtractXMLField, tLogRow. Connectez les composants laide de liens Row > Main. Le composant tFixedFlowInput sert gnrer la gamme de prix vous intressant pour ce calcul. Dans cet exemple, dfinissez 10 comme minimum et 17 comme maximum afin de prendre en compte tous les produits. Double-cliquez sur le composant tFixedFlowInput afin douvrir sa vue Component. Dans la vue Component, cliquez sur le bouton [...] ct du champ Edit schema afin douvrir lditeur de schma de ce composant. Dans lditeur de schma, ajoutez les deux paramtres min et max utiliss pour dfinir la gamme de prix.

Cliquez sur OK afin de valider cette modification. Dans la table Values dans la zone Mode de la vue Component, les deux paramtres min et max que vous avez dfinis dans lditeur de schma du composant saffichent.

Guide de Rfrence des Composants Talend Open Studio

1651

Scnario : Excuter une procdure stocke dans le hub MDM

Dans la colonne Value de la table Values, saisissez le nombre 10 pour le paramtre min et 17 pour le paramtre max.

Double-cliquez sur le composant tMDMSP afin douvrir sa vue Component.

Dans le champ URL de la vue Component, saisissez ladresse du serveur MDM, dans cet exemple : http:// localhost:8080/talend/TalendPort. Dans les champs Username et Password, saisissez les donnes dauthentification, dans cet exemple : admin et talend respectivement. Dans les champs Data Container et Procedure Name, saisissez les noms exacts du conteneur de donnes Product et de la procdure stocke PriceAddition. Sous la table Parameters (in order), cliquez deux fois sur le bouton [+] afin dajouter deux lignes cette table. Dans la table Parameters (in order), cliquez sur chaque ligne ajoute et, dans la liste droulante, slectionnez le paramtre min pour lune et le paramtre max pour lautre. Double-cliquez sur le composant tExtractXMLField afin douvrir sa vue Component.

1652

Guide de Rfrence des Composants Talend Open Studio

Scnario : Excuter une procdure stocke dans le hub MDM

Dans la vue Component, cliquez sur le bouton [...] situ ct du champ Edit schema afin douvrir lditeur de schma du composant. Dans lditeur de schma, ajoutez deux colonnes afin de dfinir la structure des donnes sortantes. Ces deux colonnes sont name et sum. Elles reprsentent respectivement le nom et le prix total de chaque type de produit enregistr dans linterface Web.

Cliquez sur OK afin de valider la configuration. Les deux colonnes saffichent dans la table Mapping de la vue Component. Dans le champ Loop XPath Query, saisissez le nud de larborescence XML sur lequel effectuer une boucle. Dans lexemple, le nud est /result comme vous pouvez lire dans le code de la procdure : return <result><Name>{$d}</Name><Sum>{sum($product/Price)}</Sum></result>. Dans le champ XPath Query de la table Mapping, saisissez le nom exact du nud sur lequel effectuer la boucle. Pour la colonne name, saisissez /result/Name, pour mapper les noms du produit. Pour la colonne sum, saisissez /result/Sum, pour extraire les prix totaux.

Guide de Rfrence des Composants Talend Open Studio

1653

Scnario : Excuter une procdure stocke dans le hub MDM

Double-cliquez sur le composant tLogRow afin douvrir sa vue Component.

Synchronisez le schma avec celui du composant prcdant (en cliquant sur le bouton Sync columns). Dans la zone Mode, slectionnez loption Table (print values in cells of a table) pour une meilleure lecture. Appuyez ensuite sur F6 afin dexcuter le Job. Les donnes sortantes saffichent dans la console de la vue Run.

La sortie liste les quatre sortes de produit enregistrs dans linterface Web MDM et le prix total pour chaque type de produit.

1654

Guide de Rfrence des Composants Talend Open Studio

tMDMTriggerInput

tMDMTriggerInput

Proprits du tMDMTriggerInput
Famille de composant Talend MDM Fonction Une fois excut, le composant tMDMTriggerInput lit un message XML (de type Document) envoy par MDM et le passe au composant suivant. Ce composant fonctionne avec le nouveau service de dclenchement et le plugin de traitement en version 5.0 et suprieure de MDM. Les Jobs, les dclencheurs et les processus MDM dvelopps dans les versions prcdentes de MDM restent supports. Il est cependant recommand d'utiliser ce composant lors de la cration de nouveau Jobs MDM. Objectif A chaque sauvegarde d'une modification dans votre MDM, l'enregistrement modifi correspondant est gnr au format XML. Lors de l'excution, ce composant lit l'enregistrement et envoie les informations relatives au composant suivant. Avec ce composant, il n'est pas ncessaire de configurer votre Job afin de le faire communiquer les modifications de donnes de MDM vers votre Job. Basic settings Property Type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Le tMDMTriggerInput doit utiliser cette option pour appliquer le schma en lecture seule par dfaut. La colonne MDM_message est l'unique colonne de ce schma. Repository : Slectionnez le fichier du Repository dans lequel les proprits sont stockes. Les champs qui suivent sont automatiquement renseigns via les donnes rcupres. Comme le composant tMDMTriggerInput fournit un schma fixe en lecture seule, vous devez utiliser l'option Built-in. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il passe automatiquement en mode Built-In. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. C'est l'option par dfaut pour le tMDMTriggerInput. Avec cette option, le schma en lecture seule est utilis pour traiter le schma du message MDM au format XML.

Guide de Rfrence des Composants Talend Open Studio

1655

Scnario associ

Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio. Comme le composant tMDMTriggerInput fournit un schma fixe en lecture seule, vous devez utiliser l'option Built-in. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant de dbut. Il requiert un flux de sortie. Pour recevoir le message de MDM, vous devez dployer le Job l'aide de ce composant sur votre serveur MDM et gnrer le dclencheur et le processus correspondants dans MDM pour invoquer ce Job. Pour plus d'informations concernant le dploiement d'un Job sur le serveur MDM et la gnration d'un dclencheur ou d'un processus, consultez le Guide administrateur de Talend Master Data Management. Pour plus d'informations concernant la modification d'un enregistrement dans MDM, consultez le Guide utilisateur de Talend MDM Web User Interface.

Limitation

Durant le dploiement de ce composant sur le serveur MDM, vous devez slectionner le type Hosted (Zip) comme format du Job dploy. Si vous le dployez dans le type Distributed (War), le Job relatif ne peut tre invoqu. Pour plus d'informations concernant les types disponibles, consultez le Guide administrateur de Talend Master Data Management Studio.

Scnario associ
Aucun scnario n'est disponible pour ce composant.

1656

Guide de Rfrence des Composants Talend Open Studio

tMDMTriggerOutput

tMDMTriggerOutput

Proprits du tMDMTriggerOutput
Famille de composant Talend MDM Fonction Le composant tMDMTriggerOutput reoit un flux XML (de type Document) du composant prcdent. Ce composant fonctionne avec le nouveau service de dclenchement et le plugin de traitement en version 5.0 et suprieure de MDM. Les Jobs, les dclencheurs et les processus MDM dvelopps dans les versions prcdentes de MDM restent supports. Il est cependant recommand d'utiliser ce composant lors de la cration de nouveau Jobs MDM. Objectif Ce composant reoit un flux XML afin de configurer le message MDM pour que MDM rcupre le message lors de l'excution. Avec ce composant, il n'est pas ncessaire de configurer votre Job afin de le faire communiquer les modifications de donnes de MDM vers votre Job. Property Type Peut tre Built-in ou Repository. Built-in : No property data stored centrally. Le composant tMDMTriggerOutput doit utiliser cette option pour appliquer le schma en lecture seule par dfaut. La colonne MDM_message est l'unique colonne de ce schma. Repository : Slectionnez le fichier du Repository dans lequel les proprits sont stockes. Les champs qui suivent sont automatiquement renseigns via les donnes rcupres. Comme le tMDMTriggerOutput fournit un schma fixe en lecture seule, vous devez utiliser l'option Built-in. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Cliquez sur Edit Schema pour modifier le schma. Notez que si vous modifiez le schma, il passe automatiquement en mode Built-In. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. C'est l'option par dfaut pour le tMDMTriggerOutput. Avec cette option, le schma en lecture seule est utilis pour traiter le schma du message MDM au format XML. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement le Guide utilisateur de Talend Open Studio.

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1657

Scnario associ

Comme le composant tMDMTriggerOutput fournit un schma fixe en lecture seule, vous devez utiliser l'option Built-in. Advanced settings Utilisation tStatCatcher Statistics Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant est un composant de fin. Il requiert un flux d'entre. Pour envoyer un message au MDM, vous devez dployer le Job l'aide de ce composant sur votre serveur MDM et gnrer le dclencheur et le processus correspondants afin d'invoquer ce Job dans MDM. Pour plus d'informations concernant le dploiement d'un Job sur le serveur MDM et la gnration d'un dclencheur ou d'un processus, consultez le Guide administrateur de Talend Master Data Management.

Limitation

Durant le dploiement de ce composant sur le serveur MDM, vous devez slectionner le type Hosted (Zip) comme format du Job dploy. Si vous le dployez dans le type Distributed (War), le Job relatif ne peut tre invoqu. Pour plus d'informations concernant les types disponibles, consultez le Guide administrateur de Talend Master Data Management Studio.

Scnario associ
Aucun scnario n'est disponible pour ce composant.

1658

Guide de Rfrence des Composants Talend Open Studio

tMDMViewSearch

tMDMViewSearch

Proprits du tMDMViewSearch
Famille de composant Fonction Talend MDM Le composant tMDMViewSearch slectionne des enregistrements dun hub MDM (Repository XML) en appliquant les filtres que vous avez crs dans un but prcis. Les donnes rcupres ont une structure XML. Pour plus dinformations concernant la vue permettant de dfinir des critres de filtres, consultez le Guide Administrateur de Talend Master Data Management. Objectif Basic settings tMDMViewSearch permet de retrouver des enregistrements MDM dun hub MDM. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma soit local (built-in) soit distant dans le Repository. Built-in : Le schma sera cr et conserv pour ce composant seulement.Voir galement : Guide Utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Jobs. Voir galement : Guide Utilisateur de Talend Open Studio. XML Field URL Slectionnez le nom de la colonne dans laquelle vous souhaitez crire les donnes XML. Saisissez lURL du serveur MDM.

Username et Password Informations dauthentification sur lutilisateur de base de donnes. Version Saisissez le nom de la Version des donnes matre laquelle vous souhaitez vous connecter, en fonction de vos droits utilisateur. Laissez ce champ vide pour afficher la Version par dfaut des donnes matre. Data Container View Name Operations Saisissez le nom du conteneur de donnes contenant les donnes que vous souhaitez effacer. Saisissez le nom de la vue dont les filtres seront appliqus pour traiter les enregistrements. Remplissez ce tableau afin de crer une clause WHERE. Les paramtres dfinir sont : - XPath : dfinissez le chemin de lexpression afin de slectionner le noeud XML sur lequel appliquer les filtres. - Functions : slectionnez un oprateur dans la liste droulante, comme Contains, Starts with, Equals, etc.

Guide de Rfrence des Composants Talend Open Studio

1659

Proprits du tMDMViewSearch

- Value : saisissez la valeur que vous souhaitez rcuprer. - Predicate : slectionnez le prdicat permettant de combiner les conditions de filtres de diffrentes manires. Le prdicat peut tre none, or, and, exactly, etc. Les paramtres sont sensibles la casse. Order (One Row) Remplissez ce tableau afin de choisir lordre de prsentation des enregistrements rcuprs. Les paramtres dfinir sont : - XPath : dfinissez le chemin de lexpression afin de slectionner le noeud XML sur lequel appliquer le tri. - Order : slectionnez lordre de prsentation, soit asc (ascendant) ou desc (descendant). Les paramtres sont sensibles la casse. Pour le moment, seule la premire ligne cre dans le tableau Order est valide. Spell Threshold Configuez cette option sur -1 afin de dsactiver le seuil. Ce seuil est utilis pour dcider du niveau de tolrance des erreurs orthographiques. Renseignez le nombre de lignes ignorer afin de spcifier partir de quelle ligne doit commencer le processus. Par exemple, si vous saisissez 8, le processus commencera la neuvime ligne. Saisissez le nombre maximal de lignes traiter. Si le champ Limit est paramtr sur 0, aucune ligne ne sera lue ou traite. Par dfaut, la valeur de ce champ est -1, ce qui signifie quaucune limite nest dfinie. Number of Lines : Indique le nombre de lignes traites. Disponible en tant que variable After. Retourne un entier. Pour plus dinformations concernant les variables, consultez le Guide utilisateur Talend Open Studio. Connections Liens de sortie (dun composant un autre) : Row : Iterate Trigger : Run if, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError. Liens dentre (dun composant un autre) : Row : Iterate; Trigger : Run if, OnComponentOk, OnComponentError, OnSubjobOk, OnSubjobError.

Skip Rows

Max Rows

Utilisation Global Variables

Utilisez ce composant pour rcuprer des enregistrements spcifiques.

1660

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer des enregistrements dun hub MDM hub via une vue existante

Pour plus dinformations concernant les connexions, consultez le Guide Utilisateur Talend Open Studio. Limitation N/A

Scnario : Rcuprer des enregistrements dun hub MDM hub via une vue existante
Ce scnario dcrit un Job comprenant deux composants rcuprant un enregistrement de donnes ayant une structure XML.

Dans cet exemple, vous allez slectionner les informations concernant le T-shirt de lentit Product via la vue Browse_items_Product cre dans Talend Open Studio. Chaque enregistrement de lentit contient les dtails dfinis comme critres de filtre : Id, Name, Description et Price (ID, Nom, Description et Prix). A partir de la Palette, dposez un composant tMDMViewSearch et un tLogRow dans lespace de modlisation graphique. Reliez les composants laide dun lien Row > Main. Double-cliquez sur le tMDMViewSearch afin douvrir sa vue Basic settings, dans longlet Component et de dfinir les proprits du composant.

Guide de Rfrence des Composants Talend Open Studio

1661

Scnario : Rcuprer des enregistrements dun hub MDM hub via une vue existante

Dans la liste Schema, slectionnez Built-In puis cliquez sur le bouton [...] ct du champ Edit schema pour ouvrir une bote de dialogue dans laquelle vous pouvez dfinir la structure des donnes XML que vous souhaitez crire.

Cliquez sur le bouton [+] pour ajouter une colonne de type String. Nommez-la Tshirt. Cliquez sur OK pour valider la modification et passer ltape suivante. Dans le champ XML Field, slectionnez Tshirt comme colonne dans laquelle vous souhaitez crire les donnes rcupres. Dans le champ URL, saisissez ladresse de votre serveur MDM et renseignez respectivement votre identifiant et votre mot de passe de connexion dans les champs Username et Password. Dans cet exemple, utilisez lURL par dfaut, puis saisissez admin comme identifiant et mot de passe. Dans le champ Data Container, saisissez le nom du conteneur de donnes : Product. Dans le champ View Name, saisissez le nom de la vue : Browse_item_Product. Sous le tableau Operations, cliquez sur le bouton [+] pour ajouter une ligne. Dans le tableau Operations, dfinissez la colonne XPath comme Product/Name, ce qui signifie que lopration de filtre sera effectue sur le noeud Name. Slectionnez ensuite Contains dans la colonne Function puis saisissez Tshirt dans la colonne Value. Sous le tableau Order (One Row), cliquez sur le bouton [+] afin dajouter une ligne. Dans le tableau Order (One Row), dfinissez la colonne XPath comme Product/Id et slectionnez lordre asc dans la colonne Order. Dans lespace de modlisation graphique, cliquez sur le tLogRow afin douvrir sa vue Basic settings et dfinir ses proprits.

1662

Guide de Rfrence des Composants Talend Open Studio

Scnario : Rcuprer des enregistrements dun hub MDM hub via une vue existante

A ct du bouton [...] utilis pour diter le schma, cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Appuyez sur F6 afin dexcuter le Job.

Dans la console de la vue Run, vous pouvez voir les enregistrements Tshirt retourns, avec leur structure XML, tris en ordre ascendant.

Guide de Rfrence des Composants Talend Open Studio

1663

Guide de Rfrence des Composants Talend Open Studio

Composants Technical
Ce chapitre fournit des informations dtailles concernant les composants de la famille Technical de la Palette de Talend Open Studio. Les composants Technical sont des composants orients Java et effectuent des actions trs techniques, comme le chargement de donnes dans la mmoire (en de petits sous-ensembles d'informations) et leur conservation pour un usage ultrieur lors du traitement.

Guide de Rfrence des Composants Talend Open Studio

tHashInput

tHashInput

Proprits du tHashInput
Ce composant est utilis avec le tHashOutput. Il lit des donnes depuis la mmoire cache, crites par le tHashOutput. Ensemble, ces deux composants permettent un accs trs rapide aux donnes afin de faciliter les transactions comprenant un grand nombre de donnes. Famille de composant Fonction Objectif Technical Le composant tHashInput lit des donnes dans la mmoire cache, crites par le tHashOutput afin de donner une grande vitesse aux flux de donnes. Ce composant lit des donnes dans la mmoire cache, crites par le composant tHashOutput afin de peupler rapidement de donnes et de faciliter les transactions comprenant un large volume de donnes. Schema et Edit schema Un schma est une description de ligne, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository). Cliquez sur Edit Schema afin de modifier le schma. Si vous modifiez le schma, il devient automatiquement built-in. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur Talend Open Studio. Link with a tHashOutput Cochez cette case pour connecter votre composant un tHashOutput. Cette case est coche par dfaut. Component list Advanced settings Utilisation tStatCatcher Statistics Liste droulante comprenant les composants tHashOutput disponibles. Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant est utilis avec le tHashOutput. Il lit des donnes depuis la mmoire cache, crites par le tHashOutput. Ensemble, ces deux composants permettent un accs trs rapide aux donnes afin de faciliter les transactions comprenant un grand nombre de donnes. n/a

Limitation

Scnario : Lire des donnes directement dans la mmoire cache afin d'y accder rapidement
Le Job suivant lit dans la mmoire cache un large volume de donnes crites par deux composants tHashOutput et envoie le contenu dans un tFileOutputDelimited. L'objectif de ce Job est de montrer la vitesse de lecture et

1666

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lire des donnes directement dans la mmoire cache afin d'y accder rapidement

d'criture des donnes. En pratique, les donnes ainsi gnres peuvent tre utilises comme table de rfrence dans certains cas o un grand volume de donnes doit tre rfrenc.

Dposer et relier les composants


1. Glissez-dposez les composants suivants de la Palette dans l'espace de modlisation graphique : tFixedFlowInput (X2), tHashOutput (X2), tHashInput et tFileOutputDelimited. 2. Reliez le premier tFixedFlowInput au premier tHashOutput l'aide d'un lien Row > Main. 3. Reliez le second tFixedFlowInput au second tHashOutput l'aide d'un lien Row > Main. 4. Connectez le premier sous-job (composant tFixedFlowInput_1) au deuxime sous-job (composant tFixedFlowInput_2) l'aide d'un lien OnSubjobOk. 5. Reliez le tHashInput au tFileOutputDelimited l'aide d'un lien Row > Main. 6. Connectez le deuxime sous-job au dernier sous-job l'aide d'un lien OnSubjobOk.

Configurer les composants


1. Double-cliquez sur le premier tFixedFlowInput pour afficher sa vue Basic settings et configurer ses proprits de base.

Guide de Rfrence des Composants Talend Open Studio

1667

Scnario : Lire des donnes directement dans la mmoire cache afin d'y accder rapidement

2. Dans la liste Schema, slectionnez Built-In. Vous pouvez slectionner Repository dans la liste Schema afin de renseigner automatiquement les champs, si la mtadonne correspondante est stocke dans le Repository. Pour plus d'informations concernant la centralisation des mtadonnes, consultez le chapitre relatifs aux mtadonnes dans le Guide utilisateur de Talend Open Studio. 3. Cliquez sur le bouton [...] ct du champ Edit schema afin de dfinir la structure des donnes du flux d'entre. Dans ce cas, le schma contient deux colonnes : ID et ID_Insurance.

4. Cliquez sur OK pour fermer la bote de dialogue. 5. Dans le champ Number of rows, saisissez le nombre d'entres crire, ici 50000. 6. Slectionnez l'option Use Single Table. Dans la table Values, saisissez, dans la colonne Value, une valeur pour chaque colonne, ici 1 pour ID et 3 pour ID_Insurance. 7. Effectuez la mme opration pour le second tFixedFlowInput et saisissez 2 pour ID et 4 pour ID_Insurance. 8. Double-cliquez sur le premier tHashOutput afin d'afficher sa vue Basic settings et dfinir ses proprits.

1668

Guide de Rfrence des Composants Talend Open Studio

Scnario : Lire des donnes directement dans la mmoire cache afin d'y accder rapidement

9. Dans la liste Schema, slectionnez Built-In puis cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent. 10.Slectionnez Keep all dans la liste Keys management. 11.Effectuez la mme opration pour le second tHashOutput. Cochez sa case Link with a tHashOutput. 12.Double-cliquez sur le composant tHashInput pour afficher sa vue Basic settings et dfinir ses proprits.

13.Dans la liste Schema, slectionnez Built-In. Cliquez sur le bouton [...] ct du champ Edit schema pour dfinir la structure des donnes, la mme que dans le tHashOutput. 14.Slectionnez tHashOutput_1 dans la liste Component list. 15.Double-cliquez sur le composant tFileOutputDelimited pour afficher sa vue Basic settings et configurer ses proprits.

16.Dans la liste Property Type, slectionnez Built-In. Dans le champ File Name, saisissez le chemin d'accs votre fichier ou cliquez sur le bouton [...] afin de parcourir votre systme jusqu' votre fichier. Ici, le chemin d'accs est le suivant : "E:/Allr70207V5.0/Talend-All-r70207-V5.0.0NB/workspace/out.csv" 17.Cochez la case Include Header puis cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent.

Guide de Rfrence des Composants Talend Open Studio

1669

Scnario : Lire des donnes directement dans la mmoire cache afin d'y accder rapidement

Excuter le Job
Sauvegardez votre Job et appuyez sur F6 pour l'excuter. Vous pouvez voir que les nombreuses entres ont t crites et lues de manire trs rapide.

Scnario associ
Pour un scnario associ, consultez : la section intitule Scnario 1 : Mapping simple de donnes avec filtre et jointure explicite du composant tMap.

1670

Guide de Rfrence des Composants Talend Open Studio

tHashOutput

tHashOutput

Proprits du tHashOutput
Ce composant crit des donnes dans la mmoire cache. Il est troitement li au tHashInput. Ensemble, ces deux composants permettent un accs trs rapide aux donnes afin de faciliter les transactions comprenant un grand nombre de donnes. Famille de composant Fonction Objectif Technical Le composant tHashOutput crit des donnes dans la mmoire cache, afin de permettre un accs rapide aux donnes. Ce composant charge des donnes dans la mmoire cache afin de permettre un accs rapide aux donnes et de faciliter les transactions comportant un large volume de donnes. Schema et Edit schema Un schma est une description de ligne, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (Built-in), soit distant (Repository). Cliquez sur Edit Schema afin de modifier le schma. Si vous modifiez le schma, il devient automatiquement built-in. Cliquez sur Sync columns pour rcuprer le schma du composant prcdent dans le Job. Built-in : Le schma sera cr et conserv pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis. Voir galement le Guide utilisateur Talend Open Studio. Link with a tHashOutput Cochez cette case pour connecter votre composant un tHashOutput. Si plusieurs composants tHashOutput sont ainsi relis, les donnes charges dans le cache par tous ces composants peuvent tre lues par un tHashInput reli l'un d'entre eux. Component list Data write model Keys management Advanced settings Utilisation tStatCatcher Statistics Liste droulante comprenant les composants tHashOutput disponibles. Liste des modes d'criture de donnes disponibles. Liste des modes de gestion de cls disponibles. Cochez cette case pour collecter les donnes de log au niveau du composant.

Basic settings

Ce composant crit des donnes dans la mmoire cache. Il est troitement li au composant tHashInput. Ensemble, ces composants permettent un accs rapide aux donnes et facilitent les transactions comportant un large volume de donnes.

Guide de Rfrence des Composants Talend Open Studio

1671

Scnario associ

Limitation

n/a

Scnario associ
Pour un scnario associ, consultez : la section intitule Scnario : Lire des donnes directement dans la mmoire cache afin d'y accder rapidement du composant tHashInput.

1672

Guide de Rfrence des Composants Talend Open Studio

Composants XML
Ce chapitre passe en revue les proprits des principaux composants prsents dans la famille XML de la Palette de Talend Open Studio. La famille XML regroupe les composants ddis aux tches lies au XML, notamment le parsing, la validation, la cration de structures XML, etc.

Guide de Rfrence des Composants Talend Open Studio

tAdvancedFileOutputXML

tAdvancedFileOutputXML

Proprits du tAdvancedFileOutputXML
Famille de composant Fonction File/Output ou XML Le composant tAdvancedFileOutputXML transmet des donnes vers un fichier de type XML et propose une interface de gestion des boucles et des Group by si ncessaire. Le tAdvancedFileOutputXML cre un fichier XML contenant les valeurs des donnes dfinies dans larborescence XML. Use Output Stream Cochez la case pour traiter le flux de donnes qui vous intresse. Une fois coche, le champ Output Stream saffiche et vous pouvez saisir le flux de donnes souhait. Le flux de donnes traiter doit tre ajout au flux afin que ce composant rcupre ces donnes via la variable reprsentative correspondante. Cette variable peut tre prdfinie dans votre Studio ou fournie par le contexte ou les composants utilis(s) avec ce composant. Sinon, vous pouvez la dfinir manuellement et lutiliser selon votre Job, par exemple laide dun tJava ou dun tJavaFlex. Afin dviter les dsagrments de la saisie, vous pouvez slectionner la variable qui vous intresse dans la liste dautocompltion (Ctrl+Espace) afin de remplir le champ, si cette variable a t correctement dfinie. Pour pus dinformations concernant lutilisation dun flux, consultez la section intitule Scnario 2 : Lire les donnes dun fichier distant en mode stream . File name Chemin daccs et nom du fichier de sortie, et/ou variable utiliser. Ce champ est indisponible si vous avez coch la case Use Output Stream. Pour plus dinformations, consultez le Guide utilisateur de Talend Open Studio. Configure XML tree Ouvre linterface daide la cration du fichier XML. Pour plus dinformations sur linterface, consultez la section intitule Dfinir un arbre XML .

Objectif Basic settings

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository.

1674

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAdvancedFileOutputXML

Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Sync columns Cliquez sur ce bouton pour synchroniser le schma de sortie avec celui dentre. La fonction Sync ne saffiche que si une connexion de type Row est lie au composant de sortie.

Append the source xml Cochez cette option pour ajouter de nouvelles lignes file la fin de votre fichier source XML. Generate compact file Cochez cette case pour gnrer un fichier ne comprenant aucun espace vide ni aucun sparateur de ligne. Lensemble des lments se prsente alors sur une ligne unique, ce qui permet de rduire le poids du fichier. Cochez cette case pour ajouter la dclaration DOCTYPE indiquant le nom de llment racine et le chemin daccs et le nom du fichier DTD ou pour ajouter linstruction de traitement indiquant le type de feuille de style (telle que les XSL) utilise et son chemin daccs et nom. DTD : saisissez le nom de llment racine dans le champ Root Element et saisissez le chemin daccs et le nom du fichier DTD dans le champ File Name. XSL : saisissez le type de feuille de style dans le champ Type et saisissez le chemin daccs et le nom du fichier dans le champ File Name. Advanced settings Split output in several Si le fichier XML de sortie est lourd, vous pouvez le files scinder en plusieurs fichiers en dfinissant un certain nombre de lignes par fichier. Create directory only if Cette case est coche par dfaut. Cette option permet not exists de crer le dossier contenant le fichier XML de sortie sil nexiste pas dj. Create empty element if Cette case est coche par dfaut. Si le contenu de la coneeded lonne Associated Column est nul ou si aucune colonne nest associe au nud XML, cette option crera une balise ouvrante et une balise fermante aux endroits prvus. Create attribute even if Cochez cette case pour gnrer lattribut de la balise its value is NULL XML pour la colonne dentre associe dont la valeur est null. Create attribute even if Cochez cette case pour gnrer lattribut de la balise it is unmapped pour la colonne dentre associe non mappe. Create associated XSD Si lun des lments XML est associ un espace de file nommage, cette option crera le fichier XSD correspondant.

Include DTD or XSL

Guide de Rfrence des Composants Talend Open Studio

1675

Proprits du tAdvancedFileOutputXML

Pour utiliser cette option, vous devez slectionner le mode de gnration Dom4J dans la liste Generation mode. Advanced separator Cochez cette option pour modifier les sparateurs utili(for number) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Generation mode Slectionnez le mode de gnration le plus rapide mais consommant de la mmoire (Fast but memory-consuming - Dom4J) ou le plus lent ne consommant pas de mmoire (Slow with no memory consumed) en fonction de votre mmoire disponible. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

Encoding

Dont generate empty Cochez cette case pour annuler la gnration du fichier file si celui-ci est vide. tStatCatcher Statistics Cochez cette case pour collecter les donnes de log du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation Limitation

Utilisez ce composant pour crer un fichier XML partir des donnes transmises par dautres composants via une connexion de type Row. n/a

Dfinir un arbre XML


Double-cliquez sur le composant tAdvancedFileOutputXML pour ouvrir linterface ddie ou cliquez sur le bouton [...] du champ Configure Xml Tree de longlet Basic settings dans la vue Component.

1676

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAdvancedFileOutputXML

Le champ Schema List de la zone Linker Source, gauche de linterface, contient toutes les colonnes du flux dentre ( condition que le flux dentre soit connect au composant tAdvancedFileOutputXML). A droite de linterface, dans la zone Linker Target, dfinissez la structure XML que vous souhaitez obtenir en sortie. Vous pouvez la crer manuellement ou tout simplement importer la structure XML. Puis importez les colonnes du schma dentre dans llment de larbre XML correspondant.

Importer un arbre XML


Le meilleur moyen de renseigner larbre XML est dimporter un fichier XML bien form. Renommez la balise racine qui saffiche par dfaut dans le panneau XML tree, en cliquant sur celle-ci. Dans la colonne XML Tree, cliquez-droit sur le champ root tag pour afficher le menu contextuel. Dans le menu, slectionnez Import XML tree. Slectionnez le fichier importer et cliquez sur OK. Vous pouvez importer la structure XML dun fichier au format XML, XSD et DTD.

Guide de Rfrence des Composants Talend Open Studio

1677

Proprits du tAdvancedFileOutputXML

La colonne XML Tree est donc automatiquement renseigne avec les lments. Vous pouvez supprimer et ajouter des lments ou des sous lments larbre : Slectionnez llment adquat dans larbre. Cliquez-droit pour faire apparatre le menu contextuel. Slectionnez Delete pour supprimer la slection de larbre ou slectionnez loption adquate parmi les suivantes : Add sub-element, Add attribute, Add namespace pour enrichir larbre.

Crer manuellement larbre XML


Si vous ne possdez pas de structure XML dj dfinie, vous pouvez la crer manuellement. Dans la colonne XML Tree, cliquez une fois sur le champ root tag pour le renommer. Cliquez droit sur ce champ pour afficher le menu contextuel. Dans le menu, slectionnez Add sub-element pour crer le premier lment de la structure. Vous pouvez aussi ajouter un attribut ou un lment enfant nimporte quel lment de larbre ou supprimer nimporte quel lment de larbre. Slectionnez llment adquat dans larbre que vous venez de crer. Cliquez-droit gauche du nom de llment pour afficher le menu contextuel. Dans le menu, slectionnez loption adquate parmi les suivantes : Add sub-element, Add attribute, Add namespace ou Delete.

Mapping de donnes XML


Une fois votre arbre XML cr, vous pouvez alimenter chaque lment ou sous-lment XML avec les colonnes du flux dentre dans la colonne Related Column : Cliquez sur une des entres de la colonne Schema List. Glissez-la dans le sous-lment correspondant droite. Relchez-la pour que le mapping soit effectif.

1678

Guide de Rfrence des Composants Talend Open Studio

Proprits du tAdvancedFileOutputXML

Une flche bleue apparat pour illustrer ce mapping. Sil est disponible, utilisez le bouton Auto-Map situ en bas gauche de linterface, il permet deffectuer cette opration automatiquement. Vous pouvez dconnecter nimporte quel mapping de nimporte quel lment de larbre XML : Slectionnez llment de larbre XML que vous souhaitez dconnecter de sa source respective. Cliquez-droit gauche de son nom pour afficher le menu contextuel. Slectionnez Disconnect linker. La flche bleue disparat.

Dfinir le statut du nud


Dfinir larbre XML et le transfert de donnes ne suffit pas. Vous devez aussi dfinir llement sur lequel la boucle est effectue et si ncessaire llment partir duquel le regroupement est effectu.

Elment Boucle
Llment Boucle permet de dfinir llment objet dune itration. Llment Boucle est gnralement un gnrateur de lignes. Pour dfinir un lment comme un lment Boucle : Slectionnez llment adquat dans larbre XML. Cliquez-droit gauche du nom de llment pour afficher le menu contextuel. Slectionnez loption Set as Loop Element.

Guide de Rfrence des Composants Talend Open Studio

1679

Proprits du tAdvancedFileOutputXML

La colonne Node Status affiche le nouveau statut slectionn. Il ne peut y avoir quun seul lment Boucle la fois.

Elment Group
Llment Group est optionnel, il reprsente un lment constant sur lequel est effectue une fonction Groupby. Llment Group ne peut tre dfini que si un lment Boucle a t pralablement dfini. Lorsque vous utilisez un lment Group, les lignes doivent tre tries pour pouvoir tre regroupes par le nud slectionn. Pour dfinir un lment comme lment Group : Slectionnez llment adquat dans larbre XML. Cliquez-droit gauche du nom de llment pour afficher le menu contextuel. Slectionnez loption Set as Group Element.

1680

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un fichier XML laide dune boucle

La colonne Node Status affiche le nouveau statut slectionn et tout autre statut de regroupement est automatiquement dfini, si ncessaire. Une fois le mapping termin, cliquez sur OK pour valider les paramtres et continuez la configuration de votre Job.

Scnario : Crer un fichier XML laide dune boucle


Le scnario suivant dcrit la cration dun fichier XML partir dun fichier plat tri contenant une vidothque.

Dans la palette de composants, cliquez sur les composants tFileInputDelimited et tAdvancedFileOutputXML et dposez-les dans lespace de modlisation. Sinon, si vous avez dj cr une mtadonne contenant la description du fichier dentre dans le noeud Metadata du Repository, alors vous pouvez cliquer-dposer directement cette mtadonne dans lespace de modlisation pour paramtrer automatiquement le flux dentre. Cliquez-droit sur le composant dentre et reliez-le au composant tAdvancedFileOutputXML laide dune connexion de type Row Main. Slectionnez le composant tFileInputDelimited et paramtrez ses proprits dans la vue Component en bas de la fentre du Studio.

Guide de Rfrence des Composants Talend Open Studio

1681

Scnario : Crer un fichier XML laide dune boucle

Dans la liste droulante Property Type, slectionnez loption Repository si la description de votre fichier est stocke dans une mtadonne du Repository. Si vous cliquez-dposez le composant directement partir de la mtadonne, vous naurez pas besoin de modifier ses proprits. Sinon, slectionnez loption Built-In et renseignez manuellement les champs de longlet Basic settings. Le fichier dentre contient les colonnes suivantes, spares par des points-virgules : id, name, category, year, language, director et cast.

Dans cette exemple, le champ Cast regroupe diffrentes valeurs et id sincrmente lorsque lon change de film. Si ncessaire, dfinissez le schma du tFileDelimitedInput en fonction de la structure du fichier.

Une fois que vous avez vrifi que le schma du fichier dentre correspond vos attentes, cliquez sur OK pour valider. Puis slectionnez le composant tAdvancedFileOutputXML et cliquez sur la vue Component pour paramtrer ses proprits, ainsi que le mapping dans longlet Basic settings. Notez que vous pouvez directement doublecliquer sur le composant pour ouvrir linterface de mapping.

1682

Guide de Rfrence des Composants Talend Open Studio

Scnario : Crer un fichier XML laide dune boucle

Dans le champ File Name, slectionnez le fichier qui sera crit la fin du Job, sil existe dj ou saisissez le chemin daccs et le nom du fichier qui seront crs automatiquement pour la sortie. Par dfaut, le schma (description du fichier) est automatiquement propag partir du flux dentre. Mais vous pouvez le modifier si ncessaire. Puis cliquez sur le bouton [...] ou double-cliquez sur le composant tAdvancedFileOutputXML dans lespace de modlisation pour ouvrir lditeur de mapping. Les colonnes du schma du fichier dentre sont listes gauche de linterface. A droite de linterface, configurez larbre XML afin quil reflte la structure du fichier de sortie. Vous pouvez soit crer la structure nud par nud. Pour plus dinformations sur la cration manuelle de larbre XML, consultez la section intitule Dfinir un arbre XML Dans cet exemple, un modle XML est utilis pour renseigner automatiquement larbre XML. Cliquez-droit sur le champ root tag qui apparat par dfaut et slectionnez loption Import XML tree la fin des options du menu contextuel. Dans la fentre Ouvrir, slectionnez le fichier XML importer et cliquez sur OK pour valider limport. Vous pouvez importer la structure XML dun fichier au format XML, XSD et DTD. Puis cliquez-dposez chaque champ de la colonne Schema List vers son lment correspondant dans larbre XML de la colonne XML tree tel que dcrit dans la section intitule Mapping de donnes XML . Le mapping apparat sous la forme dune flche bleue entre la zone de gauche et celle de droite.

Guide de Rfrence des Composants Talend Open Studio

1683

Scnario : Crer un fichier XML laide dune boucle

Enfin, dans la colonne Node Status, dfinissez le statut du nud sur lequel la boucle est effectue. Dans cet exemple, llment Cast correspondant llment Boucle puisque les donnes de ce champ dans le fichier dentre ne sont jamais les mmes. Cliquez-droit sur llment Cast de larbre XML et slectionnez loption Set as loop element. Pour regrouper les donnes par film, llment Movie doit aussi tre dfini comme lment Group. Cliquez-droit sur le nud parent Movie de larbre XML et slectionnez loption Set as group element. Le statut slectionn parat sur la ligne de llment correspondant dans la colonne Node Status. Cliquez sur OK pour valider la configuration. Puis appuyez sur F6 pour excuter le Job.

Le fichier XML de sortie affiche la structure telle quelle a t dfinie.

1684

Guide de Rfrence des Composants Talend Open Studio

tDTDValidator

tDTDValidator

Proprits du tDTDValidator
Famille de composant Fonction Objectif Basic settings XML Le composant tDTDValidator valide un fichier XML entrant en fonction dune DTD et envoie les informations de validation la sortie dfinie. Ce composant permet de vrifier les donnes et la qualit de la structure du fichier trait Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Le schma de ce composant est en lecture seule. Il contient les informations standard de validation de fichier. DTD file XML file Chemin daccs au fichier DTD de rfrence. Chemin daccs au fichier XML valider.

If XML is valid, display Saisissez un message afficher dans la console Run bas If XML is not valid de- sur le rsultat de la comparaison. tected, display Print to console Utilisation Limitation Cochez cette case pour afficher le message de validation. Ce composant peut tre utilis en standalone mais il est gnralement connect un composant de sortie pour rassembler les informations de validation. n/a

Scnario : Valider un fichier XML


Ce scnario dcrit un Job permettant de valider plusieurs fichiers dun rpertoire et de transmettre les informations de validation des fichiers non valides dans un fichier dlimit.

Cliquez et dposez les composants suivants de la Palette : tFileList, tDTDValidator, tMap, tFileOutputDelimited. Connectez le tFileList et le tDTDValidator avec un lien Iterate et les composants restants avec des liens Row Main. Paramtrez les proprits du composant tFileList afin quil rcupre les fichiers XML du rpertoire.

Guide de Rfrence des Composants Talend Open Studio

1685

Scnario : Valider un fichier XML

Dans le champ Filemask, saisissez le masque *.xml entre guillemets doubles. Paramtrez le chemin daccs des fichiers XML vrifier. Dcochez la case Case Sensitive. Dans la vue Component du composant tDTDValidate, le schma est en lecture seule puisquil contient des informations de validation standard. Paramtrez les proprits du fichier DTD utiliser comme rfrence, dans le champ DTD file.

Dans le champ Xml file, appuyez sur Ctrl+Espace pour accder la liste des variables globales et slectionnez la variable permettant de rcuprer le chemin daccs des fichiers : ((String)globalMap.get("tFileList_1_CURRENT_FILE")) Dans les divers messages afficher dans la console Run, utilisez JobName pour afficher le libell du Job. Rappelez aussi le nom du fichier grce la variable : ((String)globalMap.get("tFileList_1_CURRENT_FILE")). Cochez la case Print to Console. Dans le composant tMap, glissez-dposez les informations de validation du schma standard que vous souhaitez passer au fichier de sortie.

1686

Guide de Rfrence des Composants Talend Open Studio

Scnario : Valider un fichier XML

Une fois que le schma de sortie est dfini, ajoutez un filtre de condition pour ne slectionner que les informations lorsque le fichier XML nest pas valide. Saisissez dabord la valeur souhaite pour cette variable, loprateur en fonction du type de donnes filtres puis la variable devant correspondre cette condition, ici : 0 == $row1[validate] Puis (si cela nest pas dj effectu) connectez le tMap au tFileOutputDelimited via un lien main row. Nommez-le errorsOnly. Dans longlet Basic settings du composant tFileOutputDelimited, paramtrez le chemin daccs de destination du fichier dlimit, les sparateurs de champs et lencodage. Enregistrez le Job et appuyez sur F6 pour lexcuter.

Dans la console de la vue Run, les messages dfinis apparaissent pour chaque fichier invalide. Au mme moment, le fichier de sortie est aliment avec les informations de validation.

Guide de Rfrence des Composants Talend Open Studio

1687

tEDIFACTtoXML

tEDIFACTtoXML

Proprits du tEDIFACTtoXML
Famille de composant Fonction XML > EDIFACT /Unstructured > EDIFACT Le composant tEDIFACTtoXML lit un message EDIFACT des Nations Unies (Echange de Donnes Informatises pour lAdministration, le Commerce et le Transport) et le transforme au format XML selon la version et la famille EDIFACT. Le tEDIFACTtoXML est utilis pour transformer un fichier de message EDIFACT au format XML afin que les utilisateurs en aient une meilleure lisibilit et que la compatibilit avec les outils de traitement soit meilleure. Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma de ce composant est fixe et en lecture seule, avec une colonne : document. EDI filename EDI version Ignore new line Die on error Chemin daccs au fichier de message EDIFACT transformer. Slectionnez dans la liste la version dEDIFACT du fichier dentre. Cochez cette case pour ignorer le retour chariot dans le fichier dentre. Cette case est dcoche par dfaut et stoppe le Job en cas derreur. Cela permet de terminer le traitement avec les lignes sans erreur, et ignorer les lignes en erreur. Cochez cette case pour arrter lexcution du Job en cas derreur. Cochez cette case pour collecter les donnes de log du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Objectif

Basic settings

Advanced settings

tStatCatcher Statistics

Utilisation Limitation

Ce composant doit tre li un composant de sortie afin de rassembler les rsultats de transformation. n/a

Scnario : Passer dEDIFACT XML


Ce scnario dcrit un Job simple qui lit un fichier de message EDIFACT Customs Cargo (CUSCAR) et le sauvegarde en tant que fichier XML.

1688

Guide de Rfrence des Composants Talend Open Studio

Scnario : Passer dEDIFACT XML

Dposez un composant tEDIFACTtoXML et un tFileOutputXML de la Palette dans lespace de modlisation graphique. Connectez le composant tEDIFACTtoXML au tFileOutputXML laide dun lien Row > Main. Double-cliquez sur le composant tEDIFACTtoXML afin dafficher sa vue Basic settings.

Saisissez dans le champ EDI filename le chemin daccs au fichier du message EDIFACT dentre ou parcourez votre systme. Dans ce scnario, le fichier dentre est 99a_cuscar.edi. Dans la liste EDI version, slectionnez la version dEDIFACT du fichier dentre, D99A dans cet exemple. Cochez la case Ignore new line afin dignorer les caractres de retour chariot dans le fichier dentre durant la transformation. Laissez les autres paramtres tels quils sont. Double-cliquez sur le composant tFileOutputXML afin dafficher sa vue Basic settings.

Dans le champ File Name, saisissez le chemin daccs au fichier XML de sortie que vous souhaitez gnrer ou parcourez votre systme. Dans cet exemple, le fichier XML de sortie est 99a_cuscar.xml. Laissez les autres paramtres tels quils sont. Sauvegardez votre Job et appuyez sur F6 pour lexcuter. Le fichier du message dentre EDIFACT CUSCAR est transform au format XML et le fichier XML de sortie est gnr comme dfini.

Guide de Rfrence des Composants Talend Open Studio

1689

Scnario : Passer dEDIFACT XML

1690

Guide de Rfrence des Composants Talend Open Studio

tExtractXMLField

tExtractXMLField

Proprits du tExtractXMLField
Famille de composant Fonction Objectif XML Le composant tExtractXMLField lit la structure XML contenue dans les champs dun fichier ou dune table et en extrait les donnes. Le tExtractXMLField lit la structure XML contenue dans les champs dun fichier ou dune table, rcupre les donnes contenues dans cette structure et les envoie au composant suivant via un lien Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement.. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. XML field Nom du champ XML traiter. Voir galement le Guide utilisateur de Talend Open Studio Loop XPath query Mapping Nud de larborescence XML sur lequel est bas la boucle. Column : reflte le schma tel quil est dfini dans lditeur Edit Schema. XPath Query : Saisissez les champs extraire de la structure Xml dentre. Get nodes : Cochez cette case pour rcuprer le contenu XML de tous les nuds courants spcifis dans le champ Xpath Query, ou cochez la case correspondant un nud spcifique pour ne rcuprer que le contenu du nud slectionn. Limit Die on error Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ou traite. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traite-

Basic settings

Guide de Rfrence des Composants Talend Open Studio

1691

Scnario 1 : Extraire les donnes XML dun champ dune table de base de donnes

ment avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject. Advanced settings tStatCatcher Statistics Cochez cette case pour collecter les donnes de log du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Utilisation

Ce composant doit tre utilis en composant intermdiaire. Il ncessite donc un composant dentre et de sortie. Il permet d'extraire des donnes d'un champ dlimit l'aide d'un lien Row > Main, et permet de crer un flux de rejet avec un lien Row > Reject, filtrant les donnes dont le type ne correspond pas au type dfini. n/a

Limitation

Scnario 1 : Extraire les donnes XML dun champ dune table de base de donnes
Ce scnario est compos de trois composants et permet de lire la structure XML contenue dans les champs dune base de donnes et den extraire les donnes.

Glissez les composants tMysqlInput de la famille Database > Mysql, tExtractXMLField de la famille Xml et un composant tFileOutputDelimited de la famille File > Output de la Palette dans le Job designer. Reliez les composants entre eux via des connexions de type Main > Row. Double-cliquez sur le composant tMysqlInput pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

Si votre schma est dj stock sous le nud Db Connections dans le Repository, slectionnez loption Repository dans le champ Schema Type puis choisissez les mtadonnes appropries partir de la liste.

1692

Guide de Rfrence des Composants Talend Open Studio

Scnario 1 : Extraire les donnes XML dun champ dune table de base de donnes

Si vous navez encore dfini aucun schma, slectionnez loption Built-in et renseignez manuellement les informations de connexion et la structure des donnes dans un schma. Pour plus dinformations sur les proprits du composant tMysqlInput, consultez la section intitule tMysqlInput . Dans le champ Table Name, saisissez le nom de la table dont les champs contiennent les donnes XML. Dans ce scnario, la table se nomme customerdetails et ne contient quune seule colonne. Cliquez sur le bouton Guess Query pour rcuprer la requte correspondant votre schma. Dans le Job designer, double-cliquez sur le composant tExtractXMLField pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

Dans la liste droulante Property type, slectionnez loption Repository si la description de votre fichier est stocke dans une mtadonne du Repository. Si vous cliquez-dposez le composant directement partir de la mtadonne, vous naurez pas besoin de modifier ses proprits. Sinon, slectionnez loption Built-in et renseignez manuellement les champs suivants. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Vous pouvez cliquer sur le bouton [...] ct du champ Edit schema pour consulter le schma. Dans la liste Xml field, slectionnez la colonne dont vous souhaitez extraire le contenu XML. La colonne se nomme CustomerDetails et est lunique colonne de la table customerdetails. Dans le champ Loop XPath query, saisissez le nud de larborescence sur lequel effectuer la boucle afin de rcuprer les donnes. La colonne Column du tableau Mapping sera automatiquement renseigne avec la description du fichier que vous avez configur. Dans la colonne Xpath query, saisissez entre guillemet le nud du champ XML contenant les donnes que vous voulez extraire. Dans ce scnario, lobjectif est dextraire les noms des clients, saisissez donc CustomerName qui correspond llment XML contenant cette information. Dans le Job designer, double-cliquez sur le composant tFileOutputDelimited pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

Guide de Rfrence des Composants Talend Open Studio

1693

Scnario 2 : Extraire les donnes valides et les donnes errones partir dun champ XML dans fichier dlimit Dans le champ File Name, indiquez le rpertoire et le nom du fichier de sortie. Pour ce scnario, appelez le fichier CustomerNames.csv. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Vous pouvez cliquer sur le bouton [...] ct du champ Edit schema pour consulter le schma. Enregistrez le Job et appuyez sur F6 pour lexcuter.

Le Job retourne les noms des clients contenus sous le nud CustomerName du champ CustomerDetails de la table.

Scnario 2 : Extraire les donnes valides et les donnes errones partir dun champ XML dans fichier dlimit
Ce scnario est compos de quatre composants et permet de lire la structure XML contenue dans les champs dun fichier dlimit, den extraire les donnes et de rejeter les donnes errones.

A partir de la Palette, glissez dans le Job designer les composants tFileInputDelimited de la famille File > Input, tExtractXMLField de la famille Xml, tFileOutputDelimited de la famille File > Output et tLogRow de la famille Logs & Errors. Reliez les composants entre eux comme indiqu sur le schma ci-dessus. Double-cliquez sur le composant tFileInputDelimited pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

1694

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Extraire les donnes valides et les donnes errones partir dun champ XML dans fichier dlimit

Slectionnez loption Built-in partir de la liste droulante Schema et renseignez manuellement les informations concernant le fichier dlimit dans les champs correspondants. Cliquez sur le bouton [...] ct du champ Edit schema pour afficher la bote de dialogue permettant de dfinir la structure des donnes, comme prsent ci-dessus. Cliquez sur le bouton [+] pour ajouter autant de lignes que ncessaire la structure des donnes. Dans cet exemple, il ny a quune seule colonne dans le schma : xmlStr. Cliquez sur OK pour valider vos changements et fermer la bote de dialogue. Si vous avez pralablement stock votre schma dans le rpertoire Metadata sous File delimited, slectionnez loption Repository dans la liste droulante Schema puis cliquez sur le bouton [...] ct du champ pour afficher la bote de dialogue [Repository Content] partir de laquelle vous pouvez slectionner un schma pertinent. Cliquez sur OK pour fermer la bote de dialogue et remplir les champs automatiquement avec les mtadonnes contenues dans le schma. Pour plus dinformations sur le stockage des schmas de mtadonnes dans le Repository, consultez le Guide Utilisateur de Talend Open Studio. A partir de la liste Property type, slectionnez : -Repository si vous avez dj stock les mtadonnes de votre fichier dentre dans le Repository, les champs suivants sont alors renseigns automatiquement avec les informations stockes, ou -Built-in si aucune mtadonne nest stocke pour votre fichier dentre ; vous devez alors renseigner manuellement les champs suivants. Dans cet exemple, cest le mode Built-in qui est utilis. Dans le champ File Name, renseignez le chemin daccs ou cliquez sur le bouton [...] pour parcourir vos dossiers jusquau fichier traiter. Dans cet exemple, il sagit du fichier CustomerDetails_Error. Ce fichier csv stock localement contient une suite de lignes simples au format XML, spares par un double retour chariot. Dans le champ Row Separator, renseignez le sparateur de lignes, ici le double retour chariot. Dans le champ Field Separator, renseignez le sparateur de champ, aucun ici. Guide de Rfrence des Composants Talend Open Studio 1695

Scnario 2 : Extraire les donnes valides et les donnes errones partir dun champ XML dans fichier dlimit Dans cet exemple, il ny a pas den-tte (Header), de pied de page (Footer) ou de nombre limite de lignes traiter (Limit). Dans lespace graphique, double-cliquez sur le composant tExtractXMLField pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

A partir de la liste Property type, slectionnez : -Repository si vous avez dj stock les mtadonnes de votre fichier dentre dans le Repository, les champs suivants sont alors renseigns automatiquement avec les informations stockes, ou -Built-in si aucune mtadonne nest stocke pour votre fichier dentre ; vous devez alors renseigner manuellement les champs suivants. Dans cet exemple, cest le mode Built-in qui est utilis. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Vous pouvez cliquer sur le bouton [...] ct du champ Edit schema pour consulter le schma ou le modifier. La colonne Column du tableau Mapping sera automatiquement renseigne avec lae schma dfini. Dans la liste Xml field, slectionnez la colonne dont vous souhaitez extraire le contenu XML. Dans cet exemple, la colonne se nomme xmlStr. Dans le champ Loop XPath query, saisissez le nud de larborescence sur lequel effectuer la boucle afin de rcuprer les donnes. Dans la colonne Xpath query, saisissez entre guillemets le nud du champ XML contenant les donnes que vous voulez extraire. Dans le Job designer, double-cliquez sur le composant tFileOutputDelimited pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

1696

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Extraire les donnes valides et les donnes errones partir dun champ XML dans fichier dlimit Choisissez le mode Built-In dans la liste droulante Property Type. Dans le champ File Name, indiquez le rpertoire et le nom du fichier de sortie. Pour ce scnario, appelez le fichier CustomerNames_right.csv. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Vous pouvez cliquer sur le bouton [...] ct du champ Edit schema pour consulter le schma ou le modifier. Dans le Job designer, double-cliquez sur le composant tLogRow pour paramtrer ses proprits dans longlet Basic settings de la vue Component. Cliquez sur le bouton Sync Columns pour rcuprer le schma du composant prcdent. Pour plus dinformations sur le composant tLogRow, consultez la section intitule tLogRow . Enregistrez le Job et appuyez sur F6 pour lexcuter.

Le composant tExtractXMLField lit et extrait dans un fichier dlimit en sortie, CustomerNames_right dans cet exemple, les informations concernant les clients dont la structure XML est correcte, et affiche les lignes errones dans la console de log.

Guide de Rfrence des Composants Talend Open Studio

1697

tFileInputXML

tFileInputXML

Proprits du tFileInputXML
Famille du composant Fonction Objectif File/Input Le composant tFileInputXML lit un fichier XML structur ou un flux de donnes et extrait les donnes ligne par ligne. Ce composant lit un fichier XML structur ou un flux de donnes ligne par ligne pour le scinder en champs et envoie les champs tel que dfinis dans le schma au composant suivant du Job via une connexion Row. Property type Peut tre Built-in ou Repository. Built-in : Proprits utilises ponctuellement. Repository : Slectionnez le fichier de proprits du composant. Les champs suivants sont alors pr-remplis laide des donnes collectes. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. File name/Stream File name : Chemin daccs et nom du fichier traiter. Stream : Flux de donnes traiter. Les donnes doivent pralablement tre mises en flux afin dtre rcupres par le tFileInputXML via la variable reprsentative correspondante. Cette variable peut tre prdfinie dans votre Studio ou fournie par le contexte ou les composants utilis(s) avec ce composant, par exemple la variable INPUT_STREAM du tFileFetch. Sinon, vous pouvez la dfinir manuellement et lutiliser selon votre Job, par exemple laide dun tJava ou dun tJavaFlex. Afin dviter les dsagrments de la saisie, vous pouvez slectionner la variable qui vous intresse dans la liste dautocompltion (Ctrl+Espace) afin de remplir le champ, si cette variable a t correctement dfinie.

Basic settings

1698

Guide de Rfrence des Composants Talend Open Studio

Proprits du tFileInputXML

Pour plus dinformations concernant les flux dentre, consultez la section intitule Scnario 2 : Lire les donnes dun fichier distant en mode stream . Loop XPath query Mapping Nud de larborescence sur lequel la boucle est base. Column : Colonnes mapper. Elles refltent le schma dfini par le champ Schema type. XPath Query : Saisissez les champs extraire de lentre structure. Get nodes : Cochez cette case pour rcuprer le contenu XML de tous les nuds courants spcifis dans le champ Xpath Query, ou cochez la case correspondant un nud spcifique pour ne rcuprer que le contenu du nud slectionn. Ces nuds sont importants lorsque le flux de sortie de ce composant doit utiliser la structure XML, par exemple pour le type de donnes Document. Pour plus d'informations, consultez le Guide utilisateur de Talend Open Studio. Loption Get Nodes fonctionne en mode DOM4j et SAX, cependant avec le mode SAX, les espaces de nommage ne sont pas supports. Pour plus dinformations concernant les modes DOM4j et SAX, consultez les proprits de la liste Generation mode de longlet Advanced settings. Limit Nombre maximum de lignes traiter. Si Limit = 0, aucune ligne nest lue ou traite. Si -1, toutes les lignes sont lues ou traites, quelque soit le nombre. Cette case est coche par dfaut et stoppe le Job en cas derreur. Dcochez cette case pour terminer le traitement avec les lignes sans erreurs, et ignorer les lignes en erreur. Vous pouvez rcuprer les lignes en erreur, si vous le souhaitez. Pour cela, utilisez un lien Row > Reject. Cochez cette case afin d'ignorer le fichier DTD indiqu dans le fichier XML trait.

Die on error

Advanced settings

Ignore DTD file

Advanced separator Cochez cette option pour modifier les sparateurs utili(for number) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Ignore the namespaces Cochez cette case pour ignorer les espaces de noms. Generate a temporary file : renseignez le chemin daccs et le nom du fichier temporaire XML. Use Separator for mode Cochez cette case pour sparer les valeurs des nuds Xerces fils concatnes.

Guide de Rfrence des Composants Talend Open Studio

1699

Scnario 1 : Extraire des adresses XML

Ce champ ne peut tre utilis que si vous avez slectionn le mode Xerces dans le champ Generation mode. Le champs Field separator apparat : dfinissez le sparateur utiliser pour sparer les valeurs Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Slectionnez dans la liste droulante le mode de gnration du fichier XML en fonction de la disponibilit de votre mmoire et de la rapidit souhaite. -Fast and memory-consuming (Dom4j) : plus rapide mais consommateur de mmoire, -Memory-consuming (Xerces) : consommateur de mmoire, -Less memory consumed (SAX) :moins consommateur de mmoire. Lorsque que vous utilisez loption Get Nodes du tableau Mapping de longlet Basic settings avec le mode de gnration SAX, les noms despace ne sont pas supports. Validate date tStatCatcher Statistics Cochez cette case pour vrifier strictement le format de la date par rapport au schma dentre. Cochez cette case pour collecter les donnes de log du Job, aussi bien au niveau du Job quau niveau de chaque composant.

Generation mode

Utilisation

Ce composant doit tre utilis en tant que composant dentre. Il permet de crer un flux de donnes XML laide dun lien Row > Main, ainsi que de crer un flux de rejet avec un lien Row > Reject filtrant les donnes dont le type ne correspond pas au type dfini. Pour un exemple dutilisation de ces deux liens, consultez la section intitule Scnario 2 : Extraire les donnes XML errones dans un flux de rejet . n/a

Limitation

Scnario 1 : Extraire des adresses XML


Ce scnario trs basique est constitu de deux composants : un composant tFileInputXML qui extrait des donnes du fichier XML contenant des adresses et un composant tLogRow qui affiche le rsultat de cette opration dans la console Run via le composant tLogRow.

1700

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Extraire les donnes XML errones dans un flux de rejet

Slectionnez un composant tFileInputXML dans le dossier File de la Palette. Cliquez et dposez galement un composant tLogRow et connectez ces deux composants. Dans longlet Basic settings du composant tFileInputXML, dfinissez les proprits :

Le fichier XML contenant les adresses a t pralablement dfini dans la zone Metadata, par consquent rcuprez ses proprits en slectionnant Repository dans Property type. De cette manire, les proprits sont automatiquement rcupres et le reste des champs est renseign ( lexception du Schma). Pour plus dinformations concernant lassistant de cration de mtadonnes, consultez le Guide utilisateur de Talend Open Studio. De la mme manire, slectionnez le schma appropri dans la liste de mtadonnes du Repository. Cliquez sur Edit schema si vous souhaitez modifier le schma charg. Dans le champ Filename, indiquez le fichier structur dentre. Dans le champ Loop XPath query, modifiez le nud de boucle si ncessaire. Dans la table de Mapping, renseignez les champs extraire et afficher dans la sortie. Si le fichier est volumineux, dfinissez un nombre de ligne maximum traiter dans le champ Limit. Saisissez lencodage si ncessaire, puis double-cliquez sur tLogRow pour dfinir le caractre sparateur. Enfin, appuyez sur F6 ou cliquez sur le bouton Run dans la vue Run pour excuter le Job. Dans la console, les champs dfinis sont extraits du fichier XML structur et sont affichs.

Scnario 2 : Extraire les donnes XML errones dans un flux de rejet


Ce scnario dcrit un Job trois composants qui permet de lire un fichier XML et :

Guide de Rfrence des Composants Talend Open Studio

1701

Scnario 2 : Extraire les donnes XML errones dans un flux de rejet

dune part, de retourner les donnes XML correctes dans un autre fichier XML, et dautre part, dafficher dans la console de log les donnes errones dont le type ne correspond pas au type dfini.

A partir de la Palette, glissez les composants tFileInputXML, tFileOutputXML et tLogRow dans lespace de modlisation. Cliquez-droit sur le composant tFileInputXML, slectionnez Row > Main dans le menu contextuel, et cliquez sur le composant tFileOutputXML pour crer le lien. Cliquez-droit sur le composant tFileInputXML, slectionnez Row > Reject dans le menu contextuel, et cliquez sur le composant tLogRow pour crer le lien de rejet. Double-cliquez sur le composant tFileInputXML pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits.

Dans la liste Property Type, slectionnez Repository et cliquez sur le bouton [...] pour afficher la bote de dialogue [Repository Content] partir de laquelle vous pouvez slectionner la mtadonne relative votre fichier si vous lavez stock sous le nud File xml du rpertoire Metadata du Repository. Les champs suivants seront renseigns automatiquement. Sinon, slectionnez le mode Built-in et renseignez ces champs manuellement. Pour plus dinformations sur le stockage des schmas de mtadonnes dans le Repository, consultez le Guide Utilisateur de Talend Open Studio.

1702

Guide de Rfrence des Composants Talend Open Studio

Scnario 2 : Extraire les donnes XML errones dans un flux de rejet

Dans le champ Schema Type, slectionnez Repository et cliquez sur le bouton [...] pour slectionner le schma dcrivant la structure de votre fichier si vous lavez stock dans le Repository. Sinon, cliquez sur le bouton [...] ct du champ Edit schema et dfinissez le schma manuellement.

Dans cet exemple, le schma comprend cinq colonnes : id, CustomerName, CustomerAddress, idState et id2. Cliquez sur le bouton [...] ct du champ Filename et indiquez le chemin daccs au fichier XML. Dans le champ Loop XPath query, saisissez, entre guillemets, le chemin du nud sur lequel effectuer une boucle. Dans la table Mapping, la colonne Column est automatiquement renseigne avec les colonnes dfinies dans le schma. Dans la colonne XPath query, saisissez entre guillemets le nud du fichier XML contenant les donnes que vous voulez extraire dans la colonne correspondante. Dans le champ Limit, saisissez le nombre de lignes traiter. Dans ce scnario, lobjectif est de traiter les 10 premires lignes. Double-cliquez sur le composant tFileOutputXML pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits.

Cliquez sur le bouton [...] ct du champ File Name pour slectionner le rpertoire de destination du fichier et saisissez le nom du fichier. Dans ce scnario, appelez le fichier customer_data.xml. Dans le champ Row tag, saisissez entre guillemets le nom que vous souhaitez donner la balise contenant les donnes. Cliquez sur Edit schema et assurez-vous que le schma est rcupr du schma dentre. Si ncessaire, cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Double-cliquez sur le composant tLogRow pour afficher longlet Basic settings de la vue Component et paramtrer ses proprits.

Guide de Rfrence des Composants Talend Open Studio

1703

Scnario 2 : Extraire les donnes XML errones dans un flux de rejet

Cliquez sur Edit schema et assurez-vous que le schma est rcupr du schma dentre. Si ncessaire, cliquez sur Sync columns pour rcuprer le schma du composant prcdent. Dans la zone Mode, slectionnez loption Vertical. Enregistrez votre Job et appuyez sur F6 pour lexcuter.

Le fichier customer_data.xml contenant les donnes correctes est cr et les donnes errones sont affiches dans la console de la vue Run.

1704

Guide de Rfrence des Composants Talend Open Studio

tFileOutputXML

tFileOutputXML

Proprits de tFileOutputXML
Famille de composant Fonction Objectif Basic settings XML ou File/Output Le composant tFileOutputXML produit en sortie des donnes sous forme de fichier de type XML. Le tFileOutputXML crit dans un fichier XML des donnes spares selon un schma spcifi. File name Chemin daccs et nom du fichier de sortie, et/ou variable utiliser. Pour plus dinformations concernant lutilisation et la dfinition de variables, consultez le Guide utilisateur de Talend Open Studio. Row tag Enveloppe les donnes et la structure de chaque ligne. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champ qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Sync columns Cliquez sur ce bouton pour synchroniser le schma de sortie avec le schma dentre. La fonction Sync ne saffiche que si une connexion de type Row est lie au composant de sortie.

Advanced settings

Split output in several Si le fichier XML en sortie est volumineux, vous poufiles vez scinder ce fichier en plusieurs, chacun d'entre eux contenant un nombre spcifi de lignes. Rows in each output file : Spcifiez le nombre de lignes de chaque fichier de sortie. Create directory if not Cette case est coche par dfaut. Cette option permet de exists crer le dossier contenant le fichier de sortie sil nexiste pas dj. Root tags Spcifiez une ou plusieurs balises racine qui encadrera(ont) la structure et les donnes du fichier de sortie. La balise racine par dfaut est root. Dfinissez le format de sortie. Column : Colonnes rcupres du schma d'entre.

Output format

Guide de Rfrence des Composants Talend Open Studio

1705

Proprits de tFileOutputXML

As attribute : cochez la case de la colonnes/des colonnes que vous souhaitez utiliser comme attribut(s) de l'lment parent dans la sortie XML. Si la mme colonne est slectionne dans la table Output format comme attribut et dans les paramtres Use dynamic grouping comme critre de regroupement dynamique, seul le paramtre Use dynamic grouping sera pris en compte pour cette colonne. Use schema column name : Par dfaut, cette case est coche pour toutes les colonnes. Ainsi, les libells des colonnes du schma d'entre sont utiliss comme des balises encadrant les donnes. Si vous souhaitez utiliser une balise diffrente de celle du schma d'entre, dcochez cette cases et spcifiez une balise entre guillemets, dans le champ Label. Use dynamic grouping Cochez cette case si vous souhaitez regrouper dynamiquement les colonnes de sortie. Cliquez sur le bouton [+] pour ajouter un ou plusieurs critre(s) de regroupement, dans la table Group by. Column : Slectionnez la colonne que vous souhaitez utiliser comme lment d'encadrement pour les lignes de sortie groupes. Attribute label : Saisissez entre guillemets un libell d'attribut pour l'lment d'encadrement du groupe. Custom the flush buffer Cochez cette case pour personnaliser la taille de la msize moire utilise pour stocker temporairement les donnes, et dans le champ Row number, saisissez le nombre de lignes aprs lesquelles la mmoire est nouveau libre. Advanced separator (for Cochez cette option pour modifier les sparateurs utilinumbers) ss pour les nombres : Thousands separator : dfinissez le sparateur utilis pour les milliers. Decimal separator : dfinissez le sparateur utilis pour les dcimaux. Encoding Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes.

Don't generate empty Cochez cette case pour ne pas gnrer de fichier vide. file tStatCatcher Statistics Utilisation Limitation Cochez cette case pour collecter les donnes de log au niveau du composant.

Utilisez ce composant pour crire dans un fichier XML des donnes rcupres dautres composants laide dune connexion de type Row. n/a

1706

Guide de Rfrence des Composants Talend Open Studio

Scnario associ

Scnario associ
Un scnario utilisant le composant tFileOutputXML est dcrit dans la section intitule Scnario : Transformer un fichier positionnel en fichier XML .

Guide de Rfrence des Composants Talend Open Studio

1707

tWriteXMLField

tWriteXMLField

Proprits du tWriteXMLField
Famille de composant Fonction Objectif Basic settings XML Le composant tWriteXMLField lit un fichier XML dentre, en extrait la structure et linsre dans les champs du fichier ou de la table de sortie. Le tWriteXMLField lit un fichier XML dentre, extrait la structure du fichier et linsre dans les champs du fichier ou de la table de sortie. Output Column Configure Xml Tree Slectionnez la colonne du composant de sortie dans laquelle vous souhaitez crire la structure XML. Ouvre linterface daide la cration de la structure XML crire dans un champ. Pour plus dinformations sur linterface, consultez la section intitule Dfinir un arbre XML .

Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Built-in : Le schma est cr et conserv ponctuellement pour ce composant seulement. Voir galement le Guide utilisateur de Talend Open Studio. Repository : Le schma existe dj et est stock dans le Repository. Ainsi, il peut tre rutilis dans divers projets et Job designs. Voir galement le Guide utilisateur de Talend Open Studio. Sync columns Cliquez sur ce bouton pour synchroniser le schma de sortie avec celui dentre. La fonction Sync ne saffiche que si une connexion de type Row est lie au composant de sortie. Slectionnez la colonne utiliser pour regrouper les donnes.

Group by Advanced settings

Remove the xml decla- Cochez cette case si vous ne souhaitez pas inclure la ration dclaration XML. Create empty element if Cette case est coche par dfaut. Si le contenu de la needed colonne Related Column de linterface permettant de crer la structure XML est nul, ou si aucune colonne nest associe au noeud XML, cette option crera une balise ouvrante et une balise fermante aux endroits prvus. Create associated XSD Si lun des lments XML est associ un espace de file nommage, cette option crera le fichier XSD correspondant. Pour utiliser cette option, vous devez slectionner le mode de gnration Dom4J dans la liste Generation mode.

1708

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire la structure dun fichier XML et linsrer dans les champs dune base de donnes

Advanced separator Cochez cette case pour modifier les sparateurs utiliss (for number) par dfaut dans les nombres. Thousands separator : saisissez entre guillemets le sparateur utiliser pour les milliers. Decimal separator : saisissez entre guillemets le sparateur utiliser pour les dcimales. Generation mode Slectionnez le mode de gnration le plus rapide mais consommant de la mmoire (Fast but memory-consuming - Dom4J) ou le plus lent ne consommant pas de mmoire (Slow with no memory consumed) en fonction de votre mmoire disponible. Slectionnez lencodage partir de la liste ou slectionnez Custom et dfinissez-le manuellement. Ce champ est obligatoire pour la manipulation des donnes de base de donnes. Cochez cette case pour collecter les donnes de log au niveau du composant.

Encoding

tStatCatcher Statistics Utilisation Limitation

Ce composant doit tre utilis en composant intermdiaire. Il ncessite donc un composant dentre et de sortie. n/a

Scnario : Extraire la structure dun fichier XML et linsrer dans les champs dune base de donnes
Ce scnario est compos de trois composants et permet de lire un fichier XML, den extraire la structure puis de transmettre cette structure dans les champs dune table.

Glissez les composants tFileInputXml et tWriteXMLField de la famille Xml et un composant tMysqlOutput de la famille Database > Mysql de la Palette dans le Job designer. Reliez ces composants via des liens de type Row > Main. Double-cliquez sur le composant tFileInputXml pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

Guide de Rfrence des Composants Talend Open Studio

1709

Scnario : Extraire la structure dun fichier XML et linsrer dans les champs dune base de donnes

Dans la liste droulante Property type, slectionnez loption Repository si la description de votre fichier est stocke dans une mtadonne du Repository. Si vous cliquez-dposez le composant directement partir de la mtadonne, vous naurez pas besoin de modifier ses proprits. Sinon, slectionnez loption Built-in et renseignez manuellement les champs suivants. Pour plus dinformations sur les proprits du composant, consultez tFileInputXML, consultez la section intitule tFileInputXML . Si vous avez slectionnez loption Built-in, cliquez sur le bouton [...] ct du champ Edit schema puis dans la bote de dialogue, dcrivez manuellement la structure de votre fichier. Dans le champ Look Xpath query, saisissez sur quel nud du fichier la boucle doit tre effectue. Pour ce scnario, la boucle est effectue sur le nud customer. La colonne Column du tableau Mapping sera automatiquement renseigne avec la description du fichier que vous avez configur. Dans la colonne Xpath query, saisissez entre guillemet le nud du fichier XML contenant les donnes correspondant la colonne de gauche. Cliquez sur le composant tWriteXMLField dans le Job designer puis cliquez sur la vue Component pour lafficher et paramtrer les proprits du composant :

Cliquez sur le bouton [...] ct du champ Edit schema et, dans la bote de dialogue, ajoutez une ligne en cliquant sur le bouton [+].

1710

Guide de Rfrence des Composants Talend Open Studio

Scnario : Extraire la structure dun fichier XML et linsrer dans les champs dune base de donnes

Dans cette ligne, saisissez le nom de la colonne de votre flux de sortie que vous souhaitez renseigner avec la structure du fichier XML dans la zone de droite, CustomerDetails dans ce scnario. Dans la colonne Type de cette ligne, indiquez quelle est de type String et dans la colonne Length, indiquez quelle est de longueur 255. Cliquez sur Ok pour valider votre schma de sortie et retourner aux proprits du composant. Dans le champ Output Column, slectionnez la colonne dans laquelle vous souhaitez insrer le contenu XML. Cliquez sur le bouton [...] du champ Configure Xml Tree pour ouvrir linterface daide la cration de structures XML.

Dans la zone Link Target, cliquez sur le noeud rootTag et renommez-le CustomerDetails. Dans la zone Linker source, slectionnez CustomerName et CustomerAddress et glissez-les sur le nud CustomerDetails. Une bote de dialogue souvre vous demandant quel type daction vous souhaitez effectuer : slectionnez Create as sub-element of target node afin de crer des sous-lments au noeud CustomerDetails. Cliquez-droit sur llment CustomerName et slectionnez loption Set As Loop Element dans le menu. Cliquez sur OK. Dans le Job designer, double-cliquez sur le composant tMysqlOutput pour paramtrer ses proprits dans longlet Basic settings de la vue Component :

Guide de Rfrence des Composants Talend Open Studio

1711

Scnario : Extraire la structure dun fichier XML et linsrer dans les champs dune base de donnes

Si votre schma est dj stock sous le noeud Db Connections dans le Repository, slectionnez loption Repository dans le champ Schema Type puis choisissez les mtadonnes appropries partir de la liste. Si vous navez encore dfini aucun schma, slectionnez loption Built-in et renseignez manuellement les informations de connexion et la structure des donnes dans un schma. Pour plus dinformations sur les proprits du composant tMysqlOutput, consultez la section intitule tMysqlSCD . Dans le champ Table, saisissez le nom de la table dont les champs contiendront les donnes XML. Dans le champ Action on table, slectionnez lopration que vous souhaitez effectuer sur la table. Pour ce scnario, slectionnez Create table pour crer la table. Dans le champ Action on data, slectionnez lopration que vous souhaitez effectuer sur les donnes. Pour ce scnario, laissez loption Insert. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Vous pouvez cliquer sur le bouton [...] ct du champ Edit schema pour consulter le schma. Enregistrez le Job et appuyez sur F6 pour lexcuter.

Chaque champ de la colonne CustomerDetails est renseigne avec la structure XML du fichier de dpart : linstruction de traitement XML <?xml version=""1.0"" encoding=""ISO-8859-15""?>, le premier nud sparant chaque client <CustomerDetails> et les informations sur les clients <CustomerAddress> et <CustomerName>.

1712

Guide de Rfrence des Composants Talend Open Studio

tXMLMap

tXMLMap

Le composant tXMLMap appartient deux familles diffrentes : Processing et XML. Pour plus dinformations, consultez la section intitule tXMLMap .

Guide de Rfrence des Composants Talend Open Studio

1713

tXSDValidator

tXSDValidator

Proprits du tXSDValidator
Famille de composant Fonction Objectif Basic settings XML Le composant tXSDValidator valide un fichier XML entrant en fonction dun fichier XSD et envoie les informations de validation la sortie dfinie. Ce composant permet de vrifier les donnes et la qualit de la structure du fichier trait Mode Dans cette liste droulante, slectionnez : -File pour valider un fichier dentre, -Flow pour valider un flux dentre. Schema et Edit Schema Un schma est une description de lignes, i.e., il dfinit le nombre de champs qui sont traits et passs au composant suivant. Le schma est soit local (built-in) soit distant dans le Repository. Le schma de ce composant est en lecture seule. Il contient les informations standard de validation de fichier. Mode File unique- XSD file ment Mode File unique- XML file ment Chemin daccs au fichier XSD de rfrence. URL HTTP galement supporte, par exemple http://localhost:8080/book.xsd. Chemin daccs au fichier XML valider.

Mode File unique- If XML is valid, display Saisissez un message afficher dans la console Run bas ment If XML is invalid, dis- sur le rsultat de la comparaison. play Mode File unique- Print to console ment Mode Flow unique- Allocate ment Advanced settings Utilisation Limitation tStatCatcher Statistics Cochez cette case pour afficher le message de validation. Spcifiez la ou les colonne(s) valider ainsi que le chemin daccs au fichier XSD de rfrence. Cochez cette case pour collecter les donnes de log au niveau du composant.

Ce composant peut tre utilis en standalone mais il est gnralement connect un composant de sortie pour rassembler les informations de validation. n/a

Scnario : Valider des flux de donnes par rapport un fichier XSD


Ce scnario dcrit un Job en Java qui valide une colonne XML dans un fichier dentre par rapport un fichier XSD de rfrence et crit les informations de log concernant les lignes invalides de la colonne dans un fichier dlimit.

1714

Guide de Rfrence des Composants Talend Open Studio

Scnario : Valider des flux de donnes par rapport un fichier XSD

Pour un exemple dutilisation du tXSDValidator validant un fichier XML, consultez la section intitule Scnario : Valider un fichier XML . Dposez de la Palette dans lespace de modlisation graphique les composants tFileInputDelimited, tXSDValidator ainsi que deux tFileOutputDelimited.

Double-cliquez sur le composant tFileInputDelimited afin douvrir sa vue Component et dfinir ses proprits.

Dans la liste Property Type, slectionnez Built-In. Dans le champ File name/Stream, cliquez sur le bouton [...] afin de parcourir votre rpertoire jusquau fichier dentre. Dans le champ Header, dfinissez le nombre de lignes ignorer au dbut du fichier. Dans la liste Schema, slectionnez Built-In. Cliquez sur Edit Schema et modifiez le schma pour quil corresponde celui du fichier dentre. Dans ce scnario, le fichier dentre contient deux colonnes : ID et ShipmentInfo. La colonne ShipmentInfo est une colonne XML ncessitant dtre valide.

Guide de Rfrence des Composants Talend Open Studio

1715

Scnario : Valider des flux de donnes par rapport un fichier XSD

Dans lespace de modlisation graphique, reliez le composant tFileInputDelimited au tXSDValidator laide dun lien Row > Main. Double-cliquez sur le composant tXSDValidator et configurez ses proprits.

Dans la liste Mode, slectionnez Flow Mode. Dans la liste Schema, slectionnez Built-In. Cliquez sur le bouton Sync columns pour rcuprer le schma du composant prcdent. Pour voir ou modifier le schma, cliquez sur le bouton [...]. Cliquez sur le bouton [+] sous le tableau Allocate afin dajouter une ligne. Le nom de la premire colonne du fichier dentre apparat automatiquement dans le champ Input Column. Cliquez dans le champ et slectionnez la colonne que vous souhaitez valider. Dans le champ XSD File, saisissez le chemin daccs votre fichier XSD de rfrence. Dans lespace de modlisation, reliez le composant tXSDValidator au tFileOutputDelimited laide dun lien Row > Main afin dcrire les informations concernant les lignes XML valides. Reliez le tXSDValidator au second tFileOutputDelimited laide dun lien Row > Rejects afin dcrire les informations concernant les lignes XML invalides. Double-cliquez sur les composants tFileOutputDelimited lun aprs lautre et configurez leurs proprits. Dans le champ Property Type, slectionnez Built-In. Dans le champ File Name, parcourez votre rpertoire jusquau fichier que vous souhaitez utiliser. Dans la liste Schema, slectionnez Built-In puis cliquez sur le bouton Sync columns afin de rcuprer le schma du composant prcdent.

1716

Guide de Rfrence des Composants Talend Open Studio

Scnario : Valider des flux de donnes par rapport un fichier XSD

Sauvegardez votre Job et appuyez sur F6 pour lexcuter.

Les fichiers de sortie contiennent les informations concernant les lignes XML valides et invalides de la colonne spcifie.

Guide de Rfrence des Composants Talend Open Studio

1717

tXSLT

tXSLT

Proprits du tXSLT
Famille de composant Fonction Objectif Basic settings XML Le composant tXSLT tient compte dune feuille de style XSL pour transformer un fichier source XML et lenvoyer vers la sortie dfinie. Le tXSLT permet de transformer une structure de donnes en une autre structure. XML file XSL file Output file Chemin daccs au fichier XML transformer. Chemin daccs au fichier XSL de rfrence. Chemin daccs du fichier de sortie. Si le fichier nexiste pas, il sera cr. Le fichier de sortie peut tre nimporte quel fichier structur ou non tels que html, xml, txt ou mme pdf ou edifact en fonction de votre fichier xsl. Cliquez sur le bouton [+] pour ajouter de nouvelles lignes la liste Parameters et dfinir les paramtres de transformation du fichier XSLT. Pour chaque ligne, renseignez la cl dans la colonne name et sa valeur associe dans la colonne value.

Parameters

Utilisation Limitation

Ce composant peut tre utilis en standalone. n/a

Scnario : Transformer un fichier XML en HTML laide dune feuille de style XSL
Ce scnario dcrit un Job deux composants appliquant une feuille de style XSL un fichier XML et gnre un fichier HTML en sortie. Il permet galement de dfinir un paramtre de transformation pour la feuille de style XSL afin de changer la couleur de larrire plan de len-tte dans le document HTML cr en sortie. A partir de la Palette, cliquez et dposez un composant tXSLT et un tMsgBox dans lespace graphique.

Double-cliquez sur le tXSLT pour ouvrir la vue Basic settings et paramtrer le composant.

1718

Guide de Rfrence des Composants Talend Open Studio

Scnario : Transformer un fichier XML en HTML laide dune feuille de style XSL

Dans le champ XML file, renseignez le chemin daccs ou parcourez vos dossiers jusquau fichier XML transformer. Dans cet exemple, il sagit dune liste de titres MP3 et leurs informations associes (nom de lartiste, maison de disque...).

Dans le champ XSL file de la vue Basic settings, renseignez le chemin daccs ou parcourez vos dossiers jusquau fichier XSL appropri. Dans le champ Output file, renseignez le chemin daccs ou parcourez vos dossiers jusquau fichier HTML. Dans cet exemple, lobjectif est de convertir les donnes XML en fichier HTML comprenant un tableau constitu dun en-tte suivi de la liste du nom des artistes ct du nom des chansons.

Guide de Rfrence des Composants Talend Open Studio

1719

Scnario : Transformer un fichier XML en HTML laide dune feuille de style XSL

Dans la zone Parameters de la vue Basic settings, cliquez sur le bouton [+] pour ajouter une ligne o dfinir le nom et la valeur du paramtre de transformation du fichier XSL. Dans cet exemple, le nom du paramtre de transformation utilis est bgcolor et sa valeur est green. Double-cliquez sur le tMsgBox pour afficher la vue Basic settings et paramtrer le composant.

Enregistrez votre Job puis appuyez sur F6 pour lexcuter. Une bote de dialogue saffiche et vient confirmer que le fichier HTML est bien cr en sortie et quil est stock lendroit pralablement dfini.

1720

Guide de Rfrence des Composants Talend Open Studio

Scnario : Transformer un fichier XML en HTML laide dune feuille de style XSL

Cliquez sur OK pour fermer la bote de dialogue. Vous pouvez dsormais ouvrir le fichier HTML cr pour vrifier la transformation des donnes XML et la couleur darrire-plan de len-tte du tableau.

Guide de Rfrence des Composants Talend Open Studio

1721

Guide de Rfrence des Composants Talend Open Studio

S-ar putea să vă placă și