Sunteți pe pagina 1din 40

La numrisation

contrle

contrle

Formation LR2L
Contrle des fichiers numriques
24-25 juin 2010
Le contrle qualit dune prestation de numrisation

23/06/10

La numrisation
Sommaire

Mthodologie de contrle

typologie des contrles

stratgies de contrle

23/06/10

contrle

Outils de contrle

La numrisation
mthodologie de contrle

La notion de NQA
normes de contrle :
Les normes de contrle visent garantir la qualit d'une
production en effectuant un certain nombre d'oprations
de contrle :
- soit de manire exhaustive
- soit de manire statistique
On utilise alors les normes dchantillonnage NF X06-021
et NF ISO 2859-1
23/06/10

La numrisation
mthodologie de contrle

La notion de NQA
normes de contrle :
NF X 06-021, Principes du contrle statistique de lots, AFNOR, octobre
1991.
NF ISO 2859-1 Avril 2000 (Ancienne NF X 06-022) : Rgles
dchantillonnage pour les contrles par attributs Partie 1 : Procdures
dchantillonnage pour les contrles lot par lot, indexs daprs le niveau
de qualit acceptable (NQA).

23/06/10

La numrisation
mthodologie de contrle

La notion de NQA
Le NQA ou niveau de qualit acceptable implique le
prlvement, selon une procdure
bien dfinie, dune certaine quantit dchantillons sur un
ensemble de produits finis, afin de contrler ces
chantillons selon les normes et les spcifications en
vigueur.

23/06/10

La numrisation
mthodologie de contrle

Le calcul de NQA : effectif de lchantillon

23/06/10

La numrisation
mthodologie de contrle

La notion de NQA : seuils dacceptation et de rejet

23/06/10

La numrisation
mthodologie de contrle

La notion de NQA : la courbe defficacit dun plan


dchantillonnage
La probabilit dacceptation du lot
avec peu de non-conformit (bonne
qualit) est plus forte quavec le plan
n1 et au contraire, la probabilit
dacceptation du lot avec de
nombreuses non-conformits (lot
mdiocre) est plus faible quavec le
lot n1.
Le plan n 2 est donc plus efficace
que le plan 1. Son cot est aussi plus
lev.

23/06/10

La numrisation
mthodologie de contrle

La notion de NQA : le risque client/fournisseur


La notion de risque est induite par le
contrle par chantillon
Ce risque est diffrent suivant s'il est
pris par le client ou par le fournisseur.
Une courbe dtermine la probabilit
pour un fournisseur de se voir
refuser un lot
alors qu'il est bon et celle pour le
client de l'accepter alors qu'il est
mauvais

23/06/10

La numrisation
mthodologie de contrle

La notion de NQA : exemple


Soit un lot de 1698 fichiers Tiff contrler
Soit un NQA dfinit 1 % d'erreurs mineures
L'chantillon est de 170 vues :
Le seuil de conformit est fix 4 vues dfectueuses

23/06/10

10

La numrisation
typologie de contrles

Les contrles techniques : liste


Indexation et organisation des donnes
Nommage des fichiers
- Structure des donnes (rpertoires,)
- Cohrence de la nomenclature avec le fichier de rcolement,
- Page manquante
- Nombre de fichiers livrs,
- Ouverture, dcompression des fichiers et supports,
Prise de vues et spcifications de base
- Information tronque
- Compltude intellectuelle,
- Cadrage des images,
- Distorsion gomtrique non prsente sur le document original
- Travers suprieurs + ou 130, image incline par rapport son axe,
- sens de lecture, orientation
- Niveau d'accentuation
- Format des fichiers,
- Mauvaise rsolution,
23/06/10

11

La numrisation
typologie de contrles

Les contrles techniques : liste


Couleur
- Point blanc, point noir, balance des gris,
- Gamma,
- Drive entre le document dorigine et sa reprsentation numrise,
- drive chromatique
- Halos sur les contours des images,
- ombres portes, et prsence d'lments trangers au document
- contraste et luminosit inadapts
OCR
Taux de reconnaissance des caractres
Taux de reconnaissance des mots
Taux de reconnaissance de linformation riche smantiquement

23/06/10

12

La numrisation
typologie de contrles

Les contrles techniques : les fichiers


- exhaustivit : partir du fichier de rcolement ou en
comparant avec l'original, il faut s'assurer que le nombre
de fichiers numriques correspond bien au nombre de
vues attendues
stratgie : visualiser 5 vues en dbut, 5 vues en milieu et
5 vues en fin de document

23/06/10

13

La numrisation
typologie de contrles

Les contrles techniques : les fichiers


- nommage : partir du document de spcification, il faut
s'assurer que le plan de nommage a bien t respect et
que les fichiers sont correctement nomms (pas d'espace,
pas de caractres accentus, pas de majuscules dans les
noms de format)
stratgie : visualiser un chantillon de rpertoire pour
chaque format demand
23/06/10

14

La numrisation
typologie de contrles

Les contrles techniques : les fichiers


- format des images : partir du document de
spcification, il faut s'assurer que les formats d'images
sont valides et conformes.
2 paramtres sont vrifier :
- conformit du format
- rsolution et taux de compression
stratgie : contrle par chantillon l'aide d'un
visualiseur d'images ou de Jhove
23/06/10

15

La numrisation
typologie de contrles

Les contrles techniques : les fichiers


- conformit de la reprsentation numrique :
pour les images en niveau de gris : vrification que les niveaux de gris sont
bien homognes, que limage nest pas sur-expose ou sous-expose,
pour les images en couleur ; vrification que la couleur du document
dorigine est bien retranscrite, vrification que la plage de couleurs est bien
dynamique (cest--dire riche en nuances)

stratgie : contrle par chantillon de l'histogramme des


images
23/06/10

16

La numrisation
typologie de contrles

Les contrles techniques : le bruit


Le bruit qui se mesure par
le rapport signal / bruit
(norme ISO 15 739)

1. Bruits fixes (structurels)


2. Bruits alatoires
(thermiques, gain,)

23/06/10

17

La numrisation
typologie de contrles

Les contrles techniques : la reproduction tonale

23/06/10

18

La numrisation
typologie de contrles

Les contrles techniques : les mtadonnes


Les mtadonnes des images permettent de valider la
conformit d'un fichier par rapport aux spcifications de
format.
A long terme elles sont les garantes de la prennit de
l'information
A court terme, elles peuvent contribuer la comprhension
du contenu du document
23/06/10

19

La numrisation
typologie de contrles

Les contrles techniques : les mtadonnes


L'information doit tre cohrente entre les mtadonnes
internes et externes.
Attention notamment l'encodage des caractres ( Latin-1
ou UTF-8) et au respect des contraintes de chaque norme
(EXIF, XMP, MIX)

23/06/10

20

La numrisation
typologie de contrles

Les contrles scientifiques : le cadrage


Il faut vrifier que :

l'ensemble du document a bien t reproduit


Le cadrage est droit
La marge est conforme aux spcifications (taille, couleur)

23/06/10

21

La numrisation
typologie de contrles

Les contrles scientifiques : la lisibilit


Il faut vrifier que :
vrification quau zoom 100% les critures sont lisibles
vrification que le document est bien net sur lensemble
de limage (coins corns, paisseur de l'ouvrage, reliure
rsolution : en grossissant 1600%, 8 carrs de teintes
diffrentes doivent tre visibles

23/06/10

22

La numrisation
typologie de contrles

Les contrles scientifiques : la compltude


Il faut vrifier que :
Le tableau de rcolement correspond bien aux documents
figurant dans les dossiers contenant les images
Les supports de livraison contiennent bien le nombre de
fichiers mentionn dans le fichier de rcolement

23/06/10

23

La numrisation
typologie de contrles

Les contrles de cohrence : structure


les livrables numriques doivent reproduire l'arborescence
logique des documents originaux
mais galement tre organiss entre eux en fonction des
diffrents types de livrables attendus

23/06/10

24

La numrisation
typologie de contrles

Les contrles de cohrence : organisation


exemple d'arborescence
Racine du disque : code_etablissement_Lot
codeEtablissement_mets_collection.xml
sous-rpertoire nom de l'unit documentaire
codeEtablissement_mets_fascicule.xml
Rpertoire image de conservation
codeEtablissement_4M001_0001.tif
Rpertoire image de consultation plein cran
codeEtablissement_XXNNN_0001_P.jpg
Rpertoire OCR
codeEtablissement_XXNNN_ALTO.xml
codeEtablissement_XXNNN.rtf
Rpertoire mtadonnes techniques
codeEtablissement_XXNNN_MIX.xml

23/06/10

25

La numrisation
typologie de contrles

Les contrles de cohrence : organisation


L'arborescence documentaire est reprsente au sein des
fichiers METS.
Il est donc primordial que l'arborescence corresponde aux
liens URL saisis dans les fichiers METS.
En effet la section structMap sert la fois reprsenter la
structure logique de l'information mais galement la
structure physique de l'information

23/06/10

26

La numrisation
typologie de contrles

Les contrles de cohrence : organisation


les diffrentes versions d'une mme information doivent
tre cohrentes :

fichiers tiff / jpeg


fichiers rtf /alto / pdf
fichiers xmp / MIX / METS

23/06/10

27

La numrisation
typologie de contrles

Les contrles de cohrence : organisation


Il faut vrifier que les noms dimages correspondent bien
lordre des documents originaux (ce contrle peut
seffectuer en prenant 3 chantillons : 1 au dbut, 1 au
milieu et 1 la fin)
L'organisation des reprsentations logiques de l'information
(titre, fascicule, anne) doit permettre la navigation dans le
corpus numrique

23/06/10

28

La numrisation
stratgies de contrles

Les dlais de contrle : planification


L'opration de contrle doit tre apprhende comme un
facteur de cot.
Certaines collectivits font le choix de l'externalisation ce
qui prouve que cette procdure peut tre coteuse.
En interne, c'est la ressource humaine qui est sollicite. Il
est donc primordial d'optimiser le temps pass au contrle
qualit

23/06/10

29

La numrisation
stratgies de contrles

Le cot du contrle : optimisation


Cots de
production

Optimum
producteur

Optimum
utilisateur

Zone
doptimisation
producteur /
utilisateur
commercial
et stratgique

Cots
acceptables
Non-qualit

17/11/2010

Zone de
qualit
acceptable

Niveau de
qualit

30

La numrisation
stratgies de contrles

L'organisation du contrle : tapes


1. les contrles sur les erreurs majeures

format d'image non conforme


rsolution non conforme
numrisation non-exhaustive

2. les contrles sur les erreurs mineures

23/06/10

image partiellement floue


plage dynamique rduite
mtadonne manquante

31

La numrisation
stratgies de contrles

L'organisation du contrle : tapes


3. les contrles sur la cohrence
cohrence du rcolement
cohrence des mtadonnes techniques
cohrence des supports de livraison

3. Les contrles sur la structure


structure logique de l'information
structure des liens documentaires

23/06/10

32

La numrisation
stratgies de contrles

L'organisation du contrle : chantillonnage


Si le risque acceptable est de 1 avec un chantillon de 10% :
- sur 300 fichiers, ds que 4 fichiers sont non-conformes, le
lot est dclar invalide.
- si 2 lots sur 5 sont invalides, une procdure
d'chantillonnage renforce doit tre mise en place :
- plus de fichiers doivent tre contrls visuellement et
moins de fichiers non-conformes sont accepts

23/06/10

33

La numrisation
outils de contrles

contrle des images : XnView


configuration de l'outil
contrle des mtadonnes
contrle des histogrammes
contrle de la nettet

23/06/10

34

La numrisation
outils de contrles

contrle des fichiers :


Jhove
lignes de commandes
mode graphique
ExifTool
ligne de commande
mode graphique
XmpToolkit

23/06/10

35

La numrisation
outils de contrles

contrle des fichiers : Jhove

23/06/10

36

La numrisation
outils de contrles

contrle des fichiers : ExifTool


un outil pour extraire, lire ou crire des mtadonnes EXIF en ligne de
commande et GUI

23/06/10

37

La numrisation
outils de contrles

contrle des fichiers : XML


Avec l'aide d'diteurs XML on peut valider la syntaxe des schmas et visualiser
plus facilement l'information

23/06/10

38

La numrisation
outils de contrles

contrle des fichiers : XML


Avec l'aide d'un environnement XML, on peut transformer l'information vers
d'autres formats de prsentation plus lisibles

23/06/10

39

La numrisation
outils de contrles

contrle des livrables :

vrification des composants matriels

Le couple graveur/cd-Rom
la marque du disque dur et la vitesse de rotation

contrle de duplication

Il est possible de calculer des sommes de contrle sur les fichiers ou sur
l'ensemble d'un livrable et de comparer dans le temps l'ventuelle perte
d'intgrit

CD-ROM : possibilit de tester le BLER

23/06/10

40

S-ar putea să vă placă și