Sunteți pe pagina 1din 41

Rechercher de linformation scientifique avec Scirus et Google Scholar

Ou comment retrouver de la littrature acadmique et scientifique sur le web

Dfinition de lInformation Scientifique et Technique


L'information scientifique et technique (IST) regroupe l'ensemble des informations produites par la recherche et ncessaires l'activit scientifique comme l'industrie . (< Site du ministre de lEnseignement suprieur) De par sa nature, l'IST couvre tous les secteurs scientifiques et techniques et se prsente sous de multiples formes : articles, revues et ouvrages scientifiques spcifications techniques dcrivant des processus de fabrication documentation technique accompagnant les produits notices de brevet bases de donnes bibliographiques littrature grise (thses, rapports, actes de congrs) normes banques de donnes brutes archives ouvertes et entrepts de donnes accessibles sur internet portails, etc.

Bibliothque Michel Serres : 18/11/2008

Rechercher de linformation scientifique 1/3


Les outils de recherche traditionnels : Catalogues de bibliothques (ECL, Sudoc, WorldCat) ouvrages, thses, revues Bases de donnes bibliographiques (Pascal, Web of Science, Scopus) articles de revues, congrs, brevets Revues des grands diteurs scientifiques (Elsevier, Wiley, Springer, IoP, AIP/APS)
Avantages : fiabilit et pertinence des donnes fonctionnalits avances : interrogation dun thsaurus/vocabulaire contrl, requte complexe, cration dun compte personnel, DSI (diffusion slective de linformation), flux RSS, exploitation bibliographique Limites : accs payant (BDD et revues) usage peu intuitif ne couvre ni le web acadmique pourtant riche en IST, ni certains types de documents
Bibliothque Michel Serres : 18/11/2008

Rechercher de linformation scientifique 2/3


Apparition de nouveaux besoins et usages en dehors de ces outils payants : Succs des moteurs de recherche gnralistes sur le web, type Google Avantages : simplicit, rapidit, sources varies (inhrent au web) Limites : rpondent trs partiellement aux attentes de la communaut scientifique : bruit ou silence sources non scientifiques, pertinence variable manque de rigueur ditoriale (inhrent au web ?) htrognit des sources absence de certaines fonctionnalits (exploitation bibliographique) indexation partielle des sources (notion de web invisible ) Pourtant intrt de certaines sources web absentes des outils de recherche traditionnels : sites web acadmiques, dinstitutions, de chercheurs, blogs, archives ouvertes Alors, comment retrouver cette littrature sur le web, avec quel outil ?
Bibliothque Michel Serres : 18/11/2008

Rechercher de linformation scientifique 3/3


Plusieurs stratgies et outils de recherche sont disponibles : moteurs de recherche gnralistes scientifiques rpertoires de liens scientifiques slectionns moteurs de recherche scientifiques spcialiss (par domaines particuliers, types de documents, ou spcifiques aux ressources dites en accs libre ) Ces services doivent rpondre un dilemme : prendre en compte et donner accs aux sources dinformation traditionnelles utilises par les chercheurs (articles, congrs,) trs structures de qualit homogne (filtre ditorial) souvent prsentes dans des ressources accs rserv tout en proposant des ressources web utiles peu ou pas structures de qualit trs htrogne (pas ou peu de filtre ditorial) en accs libre, besoin dun tri pralable face la quantit de documents Russissent-ils leur pari ?
Bibliothque Michel Serres : 18/11/2008

Deux moteurs de recherche ddis la recherche dIST : Scirus et Google Scholar


Plan de lintervention : Prsentation Couverture Recherche simple Recherche avance Prsentation des rsultats Affiner ou largir sa recherche Fonctionnalits avances (dont exploitation bibliographique) Avantages / Limites Evaluation de linformation Pour aller plus loin

Bibliothque Michel Serres : 18/11/2008

Bibliothque Michel Serres :: 18 Mars 2008

Scirus Prsentation et origines


Prdcesseur : CrossRef Search Cr en 2001 par lditeur Elsevier (portail ScienceDirect) Objectif : rsoudre ce dilemme, combler ces manques et promouvoir ses revues en exploitant cette niche For scientific information only Innovation : un seul point dentre pour la recherche de littrature acadmique (articles,) et web (sites web) Stratgie : garder la simplicit (= Google respect des usages) rigueur et fonctionnalits avances ( Google et Google Scholar) indexation de contenus de revues scientifiques et de bases bibliographiques (partenariats) slection de sites pertinents en amont
Bibliothque Michel Serres : 18/11/2008

Transparence des sources indexes


Ligne ditoriale et quipe ditoriale signales sur le site (internationale, majorit anglophone) : http://www.scirus.com/srsapp/board/ Sources indexes clairement identifies : http://www.scirus.com/srsapp/aboutus/ Taille de lindex signale : http://www.scirus.com/srsapp/aboutus/#range Distinction entre plusieurs niveaux dautorit au sein des sources Une rubrique News qui informe rgulirement de lextension de la couverture du moteur (nouvelles sources indexes) http://www.scirus.com/srsapp/newsroom/

Bibliothque Michel Serres : 18/11/2008

Couverture
Pluridisciplinaire, mais les STM sont les plus reprsentes Types de documents rfrencs : articles, pr-publications, thses, rapports techniques, actes de congrs, brevets, cours, livres, 3 types de sources distinctes : Journal sources : revues lectroniques de grands diteurs, de socits savantes, (Elsevier, IOP) Preferred Web sources : des bases de type entrept ou archive institutionnels et disciplinaires, serveurs de pr-publications, bases de socits savantes (ArXiv.org, CURATOR, LexisNexis, NDLTD, PubMedCentral,) Other Web sources : des sites web acadmiques, dentreprises, slectionns (.edu, .ac.uk, .gouv,) Indexation profonde donnant accs une partie du web invisible (technologie FAST)
Bibliothque Michel Serres : 18/11/2008

Couverture : 3 types de sources?


Plusieurs versions dun mme document peuvent se retrouver dans les diffrentes catgories

Exemple : un article de revue sur ScienceDirect (Journal Sources) peut tre dpos dans une archive institutionnelle (Preferred Web Sources), et lauteur peut avoir mis une version auteur sur sa page perso (Other Web Sources)

Bibliothque Michel Serres : 18/11/2008

La recherche dans Scirus 1/2


Le plus souvent : indexation des documents en texte intgral sites web indexs dans leur totalit La recherche simple : permet de combiner des mots-cls avec diffrents oprateurs (OR, AND, NOT) en langage naturel (pas de vocabulaire contrl type thsaurus, listes fermes...) pas d'index multilingue : utiliser la langue du document recherch utiliser la troncature ou le joker ( * ou ?) pour diffrentes formes dun mot (singulier/pluriel) accentuation non prise en compte auteurs souvent mal rfrencs Peu de diffrences entre le nombre de rsultats via les outils natifs des bases indexes et Scirus (notion de priodicit de mise jour, diffrence de traitement des contenus indexs par les algorithmes)
Bibliothque Michel Serres : 18/11/2008

La recherche dans Scirus 2/2


La recherche avance : recherche multi-champs : auteur nom de publication dates Combinaison de champs remplissant les fonctions doprateurs boolens (expression exacte ; tous les mots ou un seul des mots) avec les oprateurs boolens Filtres : type de document, format de fichier, source, domaine disciplinaire La catgorisation par domaines est automatique (algorithme) et ralise par comparaison des bases de connaissances (dictionnaires) issues de corpus disciplinaires modles (+ intervention humaine pour affiner le poids des motscls). une rfrence peut appartenir plusieurs domaines disciplinaires.

Bibliothque Michel Serres : 18/11/2008

Bibliothque Michel Serres :: 18 Mars 2008

Prsentation des rsultats


Le type de document est soit clairement signal, soit il sagit dun site web ou dun fichier prsent sur un site web (cf. url et/ou poids du fichier en ko) Tri des rponses : par dfaut : pertinence autre choix : par date (NB : difficult dater un site web) Pas de traitement des doublons : si documents prsents dans plusieurs bases en mme temps : doublons dans les rsultats pas de regroupement sous une seule entre ( Google Scholar) Les rsultats issus de sites d'diteurs (accs payant) ne semblent pas favoriss dans ce cas test : deux rfrences identiques provenant d'archives ouvertes et de journaux en ligne sont classes au mme niveau dans la liste des rsultats

Bibliothque Michel Serres : 18/11/2008

Affiner ou largir sa recherche


Affiner sa recherche pour diminuer le bruit : filtrer les rsultats : par catgorie de ressources interroges : Journal sources , Preferred web , other web par type de fichier utiliser la liste de mots-cls via le panneau Refine your search (grce la catgorisation par domaines) mots-cls proposs dynamiquement (algorithme) aprs analyse des 100 premiers rsultats trouvs, une fois classs par pertinence afficher les rsultats dune source particulire : more hits from Elargir sa recherche : similar results permet d'afficher des rsultats similaires

Bibliothque Michel Serres : 18/11/2008

Bibliothque Michel Serres :: 18 Mars 2008

Fonctionnalits avances
Se constituer et conserver une bibliographie : Save checked results : sauvegarder des rfrences ATTENTION : sauvegarde uniquement par cookie Email checked results : envoi des rfrences par e-mail Export checked results : export vers un logiciel de gestion bibliographique (format RIS conseill) Dfinir ses prfrences de recherche via Preferences Library Partner Links : partenariat avec les bibliothques pour faciliter le lien vers le texte intgral des documents (technologie OpenURL). Possibilit de soumettre un site web pour rfrencement dans ce moteur, via un formulaire, avec domaines disciplinaires de rattachement : Submit Web Site

Bibliothque Michel Serres : 18/11/2008

Bibliothque Michel Serres :: 18 Mars 2008

Bibliothque Michel Serres :: 18 Mars 2008

Avantages / Limites
Avantages : recherche pluridisciplinaire en texte intgral sur un corpus constitu la fois de sources web de qualit et de documents acadmiques plus classiques recherche de brevets reprer rapidement des sources valides (BDD, titres de revues) recherche de versions en libre accs de documents en texte intgral payants Limites : pas de possibilit de raliser du citation tracking : systme permettant un rebond via les citations sortantes et entrantes des rfrences ex : la fonction cited by du Web of Science ou de Google Scholar pas de ddoublonnage nombreuses sources payantes

Bibliothque Michel Serres : 18/11/2008

Google Scholar Prsentation et origines


Cr en 2004 par Google, en mme temps que Google Print (Google Search Books) Sur les paules dun gant Lobjectif de Google : Googles mission is to organize the worlds information offrir une diversit doutils et devenir la 1re porte daccs vers linformation construire de nouveaux marchs sur lexploitation de nouvelles sources dinformations (ici la littrature scientifique) Google Scholar se positionne en rival par rapport aux offres commerciales de BDD similaire Scirus dans son approche : rapidit et simplicit dutilisation : Google like accs libre augmente la visibilit de la littrature scientifique sur le web facilite laccs au texte intgral des publications adapte les technologies Google (ex : PageRank) et construit un algorithme qui dfinit ce qui est scholarly sur le web.
Bibliothque Michel Serres : 18/11/2008

Lapproche de Google Scholar

In : Mayr, P. & Walter, A.-K. An exploratory study of google scholar. Online Information Review, 31, 814-830 (2007).
Bibliothque Michel Serres : 18/11/2008

Opacit des sources indexes


Opacit de lalgorithme et des technologies utilises : que dfinit-il par scholarly ? Google scholar ne donne : aucune liste de ses sources aucune information sur le type de document trait aucune information sur la priode couverte aucune information sur le volume disponible

Bibliothque Michel Serres : 18/11/2008

Couverture suppose
Pluridisciplinaire, mais les STM sont les plus reprsentes Remplacer que GS inclut des textes issus souhaitez utiliser la police Arial. Il est clair ce texte-ci par le votre si vous : de lOpen Access, des Archives Ouvertes (ArXiv, HAL) des serveurs acadmiques (.edu, Universits, Grandes Ecoles) des socits savantes et diteurs scientifiques participant CrossRef (ACM, Springer, Wiley-Blackwell, IEEE, Nature publishing) des bases de sommaires (IngentaConnect) et collections de revues, les revues dElsevier avec ScienceDirect (accord en 2007) des catalogues de bibliothques et dinstitutions (WorldCat, Sudoc, INIST) GS indexe donc une partie du web invisible Types de documents rfrencs : livres, thses, articles de revues scientifiques, pr-publications, rsums, proceedings, rapports techniques

Bibliothque Michel Serres : 18/11/2008

La recherche dans Google Scholar


Recherche dans le texte intgral et pas seulement dans les mtadonnes (auteurs, titres, rsums) Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. La recherche simple : permet de combiner des mots-cls avec diffrents oprateurs se fait en langage naturel, utiliser : la langue dans laquelle on veut retrouver des documents des synonymes des termes scientifiques la recherche par auteur pose problme (utiliser loprateur author:) La recherche avance : des champs remplissent les fonctions des oprateurs boolens : ex : recherche dune expression exacte rechercher par auteur, nom de publication et intervalle de dates rechercher le terme dans tout le document ou uniquement dans le titre limiter sa recherche aux domaines scientifiques dans linterface en anglais
Bibliothque Michel Serres : 18/11/2008

Les oprateurs utilisables dans Google scholar

Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial.

Bibliothque Michel Serres : 18/11/2008

Prsentation des rsultats


Types de documents : rfrence normale : lien vers une rfrence bibliographique (par ex dun catalogue de bibliothque), donne accs au moins au la police Arial. Remplacer ce texte-ci par le votre si vous souhaitez utiliser rsum du document. [DOC] ou [PDF] suivi de : indique le format du document et la prsence dun lien direct vers le texte intgral [CITATION] : citation dans un document (bibliographie) mais pas de lien [BOOK] : indique un livre, souvent indisponible en texte intgral possibilit de le localiser dans une bibliothque partir du lien Trouver ce livre dans une bibliothque dans Google Book Search ou bien SUDOC Catalogue par ex. Informations prsentes : titre du document, auteurs, nom de la revue, date, diteur serveur do provient le document (nom de domaine) Gestion des doublons : les diffrentes versions du document sont regroupes sous la fonction all X versions . Est mise en avant la version en accs libre.
Bibliothque Michel Serres : 18/11/2008

Affiner ou largir sa recherche


Affiner sa recherche : filtrer ce texte-ci par Remplacerles rsultats : le votre si vous souhaitez utiliser la police Arial. Recent articles affiche les dernires publications. Une liste droulante permet ensuite de prciser lanne de dpart. Liens vers les auteurs principaux en bas de page Elargir sa recherche : Web Search lance dans Google une requte avec le nom du premier auteur et des mots ou expression du titre du document. Related articles renvoie des rsultats similaires au document.

Bibliothque Michel Serres : 18/11/2008

Fonctionnalits avances
Dfinir ses prfrences de recherche via Scholar Preferences langue de linterface : quatorze langues dont le franais langue de recherche : 8 langues dont le franais, par dfaut pas de limite de langue library Links : partenariat avec les bibliothques pour faciliter le lien vers le texte intgral des documents (utilise la technologie OpenURL, rsolveur de liens). choix du logiciel de gestion bibliographique : format RefWorks, BibTeX, EndNote, RefMan ou WenXianWang Se constituer une bibliographie : Import into : export vers un logiciel de gestion bibliographique

Bibliothque Michel Serres : 18/11/2008

valuation des rsultats dans Google Scholar 1/2


Indication du taux de citations : Cited by identifie, depuis lindex de Google Scholar, le nombre de fois o Remplacer ce texte-ci par le par dautres documents utiliser la police Arial. ce document a t cit votre si vous souhaitez + liens vers ces documents index de citations construit partir de la technologie ACI (Autonomous Citation Index) permet de relever la pertinence du document selon son impact Avantages par rapport au Web of Science : permet de trouver des citations uniques : ouverture de GS aux revues ne faisant pas partie de la liste du WoS ouverture sur la littrature non anglophone meilleure prise en compte des citations provenant dautres types de documents (proceedings,) meilleure gestion des doublons

Bibliothque Michel Serres : 18/11/2008

valuation des rsultats dans Google Scholar 2/2 Lanalyse de citations de Google Scholar :
un outil complmentaire du WoS

Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Limites : GS peut inclure des citations non-scientifiques (provenant de travaux dtudiants) toutes les revues scientifiques ne sont pas indexes par GS disparit selon les disciplines mauvaise reprsentation des publications anciennes lACI peut gnrer de grossires erreurs mise jour irrgulire de lindex comme dans toutes les bases : mauvaise gestion des auteurs

Bibliothque Michel Serres : 18/11/2008

Avantages / Limites
Avantages : gratuit, simplicit dutilisation recherche fdre sur votre si vous souhaitez utiliser Remplacer ce texte-ci par leun corpus dit scientifique la police Arial. augmente la visibilit de la littrature acadmique identifie limpact dune ressource par son taux de citation : dmocratisation de lusage bibliomtrique permettant aux chercheurs de suivre limpact scientifique de leurs publications sur le Web

bnficie dun bon accueil de la part de la communaut scientifique


Limites : opacit de lalgorithme et des technologies utilises nest pas exhaustif : couverture relle inconnue ambigut de linterrogation en langage naturel, indexation automatique erreurs dans les rsultats (doublons, auteurs) erreurs sur les citations, index de citations incomplet GS nest pas une ressource pour trouver du texte intgral cependant il en facilite laccs

Les outils de recherche traditionnels restent incontournables !!


Bibliothque Michel Serres : 18/11/2008

Conclusion
Conseils dutilisation de Scirus et Google Scholar : Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. pour une premire approche et une recherche non exhaustive sur un sujet pour une recherche croise et multidisciplinaire pour trouver des ressources en texte intgral, en libre accs pour suivre limpact scientifique dune publication sur le web (GS) pour trouver un article spcifique dans un journal spcifique pour trouver des ressources rcentes et en complment des bases de donnes spcialises !

Bibliothque Michel Serres : 18/11/2008

Pour en savoir plus - Scirus


Elsevier, Scirus. 2007a. About Us [en ligne]. Disponible sur : <http://www.scirus.com/srsapp/aboutus/> , (consult le 2/12/2008) Elsevier, Scirus White Paper. How Scirus Works [en ligne]. Disponible sur : <http://www.scirus.com/press/pdf/WhitePaper_Scirus.pdf>, (consult le 2/12/2008) Elsevier, Scirus Topic Pages Demo [en ligne]. Disponible sur : <http://info.scirus.com/topicpagesdemo/>, (consult le 2/12/2008) Jacso, P. SCIRUS. In : Peters Digital Reference Shelf, dcembre 2006 [en ligne]. Disponible sur : <http://www.galegroup.com/reference/peter/2006/12/scirus.htm>, (consult le 2/12/2008) Lardy J.P. SCIRUS support de cours, mai 2007 [en ligne]. Disponible sur : <http://urfist.univ-lyon1.fr/SCIRUS.pdf>, (consult le 2/12/2008) Marois, A. SCIRUS :for scientific information only ?, mars 2008 [en ligne]. Disponible sur : http://bibli.ec-lyon.fr/documents/Scirus_support_diff.pdf, (consult le 2/12/2008) Notess Greg R., Scholarly Web Searching : Google Scholar and Scirus. Online Vol. 29 No. 4 Jul/Aug 2005 [en ligne] Disponible sur : <http://www.infotoday.com/online/jul05/OnTheNet.shtml>, (consult le 2/12/2008) Tompson, Sara R. Scirus -- for Scientific Information. Issues in Science and Technology Librarianship, n 49, 2007 [en ligne]. Disponible sur : <http://www.istl.org/07-winter/electronic3.html>, (consult le 2/12/2008)
Bibliothque Michel Serres : 18/11/2008

Pour en savoir plus Google Scholar


Denison Memorial Library, Expert Googling & Google Scholar, 2007 [en ligne]. Disponible sur : http://hsclibrary.uchsc.edu/handouts/class-handouts/expertgoogling.pdf, (consult le 2/12/08) Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Google, Google Scholar : Need six authoritative, relevant sources? Before sunrise? 2006 [en ligne]. Disponible sur : http://www.google.com/librariancenter/downloads/Scholar_85x11.pdf, (consult le 2/12/08) Harzing, A-W., Van Der Wall R., Google Scholar : the democratization of citation analysis?, sept 2008 [en ligne]. Disponible sur : http://www.harzing.com/resources.htm#/pop.htm, (consult le 2/12/08). Mayr, P. & Walter, A.-K. An exploratory study of google scholar. Online Information Review 31, 814-830 (2007) [en ligne]. Disponible sur : http://arxiv.org/abs/0707.3575, (consult le 2/12/08) Lardy JP, Google Scholar, Urfist de Lyon, septembre 2008 [en ligne]. Disponible sur : http://urfist.univ-lyon1.fr/GoogleScholar.pdf, (consult le 2/12/08) Pomerantz, J. Google Scholar and 100% Availability of Information. InformationTechnology and Libraries, 25(1), 52-56 (2006) [en ligne]. Disponible sur : http://ils.unc.edu/~jpom/pubs/Preprint-ITAL-2006.pdf, (consult le 2/12/08) Quint B, Library Collections Linked on Google Scholar for Free, Information Today, Inc., Mai 2005 [en ligne]. Disponible sur : http://newsbreaks.infotoday.com/nbreader.asp?ArticleID=16204, (consult le 2/12/08)

Bibliothque Michel Serres : 18/11/2008

S-ar putea să vă placă și