
Vous êtes ici : Accueil » Formation et ressources » Documentation d'appoint » Stratégies de recherche
Le World Wide Web est un océan d'informations. Si l'on compte dix documents pour chacun des 30 millions de serveurs, on obtient 300 millions de documents disponibles. Il s'agit d'une gigantesque librairie, sans bibliothécaire. Toutefois, certaines portes d'entrée, les outils de recherche, aident à s'y retrouver. Il s'agit de logiciels automates, de robots, qui recensent et explorent les sites web. Apprendre à les utiliser est un gage de succès dans vos recherches.
L'explosion du WWW a entraîné l'apparition de nombreux outils de recherche. Alta Vista, HotBot, Francité, la Toile du Québec sont des exemples connus. Les outils de recherche se divisent en deux grandes familles, qu'il convient de distinguer.
Sommaire
Un moteur est un robot qui recense des millions de site. Il accumule dans une base de données les informations qu'il trouve. Il interroge cette base de données au moment de votre requête. Autrement dit, il s'agit d'un logiciel automate qui visite les sites de la planète et y pige quelques mots clés. Il les place sur une fiche afin d'identifier le site visité. Lorsque vous faites une recherche à l'aide du moteur, celui-ci compare les mots clés de la requête avec ceux contenus sur les fiches. Il génère ensuite une page web présentant les adresses des sites pertinents aux mots clefs utilisés.
L'interface d'un moteur offre toujours un formulaire à remplir avec des mots clés, les mots de la recherche. Une formulation juste de la requête, c'est à dire un bon choix des mots clefs et de leur agencement, vous permettra d'obtenir des résultats probants.
D'une façon générale, avant d'initier votre recherche, il est préférable d'écrire un petit texte de quelques lignes sur l'information recherchée, puis d'entourer les mots importants qui deviendront les mots clefs de votre recherche. Si ceux-ci ont plusieurs sens (chemise, serviette, journal, serveur,...) ou s'ils sont trop vagues (société, économie, communautaire,...) il faudra sans doute les remplacer par des mots plus précis, plus spécifiques.
Par ailleurs, le résultat de votre recherche dépend de la formulation d'une requête avec ces mots. Pour apprendre à le faire adéquatement, nous vous invitons ici à vous familiariser avec la logique utilisée par les moteurs de recherche. Le temps investi vous sera remis au centuple lors de vos recherches.
La plupart des moteurs de recherche offrent deux options de recherche: la recherche simple et la recherche avancée. La première, comme son nom l'indique, sert à interroger la base de données du moteur à l'aide d'une syntaxe, d'une formulation simple. Ce type de recherche s'avère utile pour chercher une information précise, le site d'un organisme par exemple, en utilisant le nom de l'organisme ou son abréviation.
Si vous désirez faire une recherche plus générale, en utilisant des mots clefs, et que vous voulez obtenir des résultats précis, vous aurez avantage à utiliser les fonctions avancées des moteurs de recherche. Vous devrez alors formuler votre requête d'une façon très précise, ce qui favorisera l'exactitude des résultats.
Avant de passer aux exemples et aux explications, qui vous mèneront de la recherche simple à la recherche avancée, nous vous présentons l'autre type d'outil de recherche: le répetoire de sites.
Le répertoire de sites est un outil de recherche caractérisé par le classement préalable de l'information au sein d'un site web. Un peu à la manière des «pages jaunes», on trouve dans un répertoire une liste de sites regroupés par thèmes: société, économie ou culture, par exemple. L'entreprise propriétaire du répertoire a cherché et classé des milliers de sites. Ainsi, la recherche qu'on y effectue peut être qualifiée de thématique. On part d'un thème, «société» par exemple et l'on suit l'arborescence, cherchant plus ou moins au hasard, des informations liées à notre thème de départ.
Une première limite des répertoires se situe au niveau de la classification elle-même. Souvent arbitraire, elle ne correspond pas toujours à l'idée que vous vous faîtes du monde. Par exemple, sous la rubrique «société» de la Toile du Québec on ne retrouve pas «communautaire» ou «syndicats». Néanmoins, les répertoires sont dotés d'un moteur de recherche, bien que ceux-ci soient généralement peu puissants voire carrément déficients. Pour effectuer une recherche précise, il vaut mieux utiliser un véritable moteur de recherche.
Les annuaires ont, bien sûr, leur raison d'être. Plus on les consulte, plus on comprend leur organisation. De plus, ils s'avèrent très utiles pour dénicher des sites pratiques, des entreprises connues ou des personnes. L'annuaire «La Toile du Québec» possède d'ailleurs un répertoire unique des pages personnelles.
Peu importe que vous préfériez les moteurs ou les annuaires, vous devez vous familiariser avec la logique de la recherche et connaître quelques trucs afin d'affûter votre stratégie.
Il n'existe pas de recette magique garantissant des résultats de recherche probants. Les exemples et les explications qui suivent vous familiariseront avec une méthode et un moteur de recherche. La plupart des notions présentées vous seront utiles peu importe le moteur que vous adopterez.
Il n'existe pas de recette magique garantissant des résultats de recherche probants. Les exemples et les explications qui suivent vous familiariseront avec une méthode et un moteur de recherche. La plupart des notions présentées vous seront utiles peu importe le moteur que vous adopterez.
Altavista est un moteur de recherche très performant, très populaire auprès des internautes et disponible en plusieurs langues. Il existe également une version canadienne-française du site d'Altavista.
Nous l'avons choisi afin d'illustrer les principes ci-dessous à l'aide d'exemples. Notez que l'utilisation de caractères gras sert à démarquer les mots de l'exemple de ceux de la phrase.
Une recherche s'effectue à partir de mots clefs, relatifs à l'information que l'on veut trouver. Pour les fins de notre propos, prenons les mots alphabétisation et populaire.
La recherche simple s'effectue à partir de la page d'accueil de Altavista. Dans la case de saisie qui s'y trouve, nous écrirons alphabétisation populaire. Si nous inscrivons cette expression telle quelle et lançons la recherche, le moteur cherchera les sites qui contiennent un des mots ou les deux. Donc les sites retenus par le moteur comme répondant à la requête contiendront soit le mot alphabétisation soit le mot populaire ou les deux. Résultat : Environ 77 445 documents correspondent à cette requête dans l'index mondial.
Si l'on désire trouver les sites qui contiennent les deux mots, alors il faut utiliser le signe +, par exemple +alphabétisation +populaire. Ce qui donne un résultat plus raisonnable, soit 762 documents. Dans les deux cas, les mots alphabétisation et populaire peuvent se trouver à n'importe quel endroit sur un site. Il ne sont pas nécessairement adjacents l'un à l'autre. À l'aide de guillemets, il est possible de rechercher l'expression «alphabétisation populaire». Nous obtenons alors 99 sites web qui correspondent à notre requête.
Notez enfin qu'une recherche effectuée à l'aide de mots écrits en lettres minuscules identifiera les pages où se trouvent ces mots soit en minuscule soit en majuscule. Une recherche formulée en majuscules ne trouvera que les sites contenant les mots en majuscules.
Nous avons démontré jusqu'ici le potentiel et l'utilité de stratégies de recherche raffinées. Elles permettent de gagner un temps précieux. Toutefois, il est possible de raffiner encore plus nos requêtes en utilisant les fonctions avancées de la recherche.
La recherche «simple» donne souvent des résultats trop nombreux pour qu'ils puissent tous être consultés. Utiliser la recherche avancée vous permet de cibler votre tir. Elle s'effectue à partir d'une autre interface et elle possède sa propre case de saisie. À la page d'accueil du moteur de recherche, cliquez sur le bouton «recherche avancée» pour y accéder.
Vous pouvez d'abord choisir l'univers dans lequel vous voulez effectuer une recherche. Altavista vous offre le choix entre différentes catégories: le monde, le Canada, les nouvelles, les sites gouvernementaux ou les forums «Usenet». Choisir un petit univers (les sites gouvernementaux) plutôt qu'un plus grand (le Canada) peut vous donner plus rapidement de meilleurs résultats.
Il est aussi possible d'effectuer une recherche qui tiendra compte de la date de mise à jour d'un site. Ainsi, en inscrivant le 3 juin 1998 (3/Jui/1998) dans la case de saisie appropriée (vous pouvez laisser l'autre case vide) vous n'obtenez que les sites mis à jour depuis cette date.
Tous les moteurs de recherche (tous les automates) fonctionnent selon la logique booléenne qui consiste à connecter des éléments, à lier entre eux des mots. Les plus utilisés en recherche sont: et (and), ou (or), non (not). Il existe un autre connecteur, près de (near). Comme vous le voyez, derrière une expression rébarbative, se cachent des mots de tous les jours. Vous devrez toutefois les utiliser en anglais. Les exemples qui suivent vous aideront à saisir quelques nuances et à construire des requêtes précises.
Le connecteur and force le moteur de recherche à trouver des sites qui contiennent les deux éléments liés par ce connecteur (alphabétisation and populaire). Le connecteur or spécifie au moteur qu'il doit chercher des sites contenant un des deux éléments joints (alphabétisation or populaire). Le not sert à spécifier que l'on désire exclure certains résultats de recherche à l'aide d'une information. Par exemple, la requête suivante alphabétisation and populaire not France donnera comme résultat les sites qui contiennent les mots alphabétisation et populaire mais pas le mot France. Enfin le connecteur near stipule au moteur que nous cherchons deux mots à proximité l'un de l'autre, dans un rayon de dix mots (alphabétisation near populaire).
La principale force de la recherche avancée ne réside pas dans l'articulation de requêtes aussi élémentaires. Vous aurez remarqué qu'une recherche simple vous donnera à peu près les mêmes résultats, sans avoir à formuler des énoncés avec les connecteurs. Tout le potentiel de la recherche avancée réside dans les multiples combinaisons que l'on peut faire entre différents énoncés et dont la complexité n'a pour limite que votre imagination.
Certaines fonctions permettent d'interroger de façon très pointue la base de données d'Altavista. Utilisées avec les connecteurs, ces fonctions favorisent des résultats de recherche très précis. Elles doivent être saisies dans la fenêtre de recherche avancée. En voici une sélection.
link: cherche des pages contenant un hyperlien vers une page spécifique.
exemple: link:www.communautique.qc.ca identifiera les sites qui pointent vers cette adresse.
domain: la recherche se fera alors dans le domaine spécifié.
exemple: domain:.ca effectuera la recheche sur les serveurs du domaine .ca
url: cherche des pages contenant un mot spécifique à l'intérieur de l'adresse.
exemple: url:CLSC trouvera des sites qui contiennent CLSC dans l'adresse.
host: Trouve des pages déposées sur un serveur spécifique.
exemple: host:www.gouv.qc.ca cherchera des informations contenus sur le serveur du gouvernement du Québec
text: Trouve toutes les pages contenant le texte spécifié.
exemple: txt:inforoute cherchera les sites qui contiennent le mot «inforoute», même si celui-ci n'apparaît pas le titre du site ou dans les méta-étiquettes.
Voici quelques exemples de recherche avancée
host :gouv.qc.ca AND text:inforoute
Afin trouver sur le serveur du gouvernement du Québec les documents sur l'inforoute.
host :gouv.qc.ca AND («économie sociale» AND NOT chantier)
Afin trouver sur le serveur du gouvernement du Québec des documents sur l'économie sociale, sauf ceux où l'on retrouve le mot le chantier.
text : hochelaga AND (url:clsc OR url:cdec)
Trouvera des documents sur Hochelaga dans les sites dont l'adresse contient CLSC ou CDEC.
link:www.liberation.com/multi/cahier/articles/sem99.23/cah990604a.html
Un article du quotidien français Libération loge à cette adresse compliquée, que l'on peut d'ailleurs saisir à l'aide du copier-coller. La fonction link nous permettra de savoir si un autre document sur internet pointe vers cet article, nous donnant ici des pistes de recherche proches du sujet traité.
Google est un autre moteur de recherche, de plus en plus populaire étant donné sa grande simplicité. Les adeptes de Google apprécient l'efficacité de cet outil qui effectue ses recherches selon la pertinence. Google limite ses résultats aux pages Web qui contiennent tous vos termes de recherche (dans le texte de la page ou dans les liens qui pointent sur celle-ci). La version canadienne se trouve à l'adresse suivante : http://www.google.ca. Sur la page d'accueil, un simple clic vous permet ensuite de consulter le site en français.
Pour effectuer nos recherches, nous utiliserons les mots organisme communautaire. Une fois ces mots inscrits dans la case de saisie de la page d'accueil de Google, trois choix s'offrent à nous. Vous pouvez demander à Google d'effectuer sa recherche soit dans tout le Web, soit dans les pages uniquement francophones ou soit dans les pages publiés à partir de serveurs se trouvant au Canada.
Recherche sur le Web : 167 000 pages trouvées
Recherche sur les sites francophones : 163 000 pages
Recherche sur les pages Canada : 80 300
On peut réduire les résultats de recherche en créant une expression (une suite de termes qui se suivent) entre guillemets. En écrivant "organisme communautaire", on obtient les résultats suivants :
Recherche sur le Web : 11 100 pages trouvées
Recherche sur les sites francophones : 10 500 pages
Recherche sur les pages Canada : 9 530
La recherche simple, sur Google, peut donc être raffinée, sans pour autant avoir recours à la recherche avancée. Si l'on souhaite cependant arriver à des résultats beaucoup plus précis, la recherche avancée s'impose.
Dans la page d'accueil de Google, cliquez sur recherche avancée. La requête est construite à partir d'un formulaire de saisie. On inscrit les termes dans les cases appropriées et Google génère ensuite la requête.
Les premiers critères de recherche concernent les termes à rechercher. Vous pouvez demander de trouver les pages contenant tous les mots suivants, une expression exacte, au moins un des mots suivants, ou aucun des mots suivants.
Vous pouvez ensuite spécifier la langue dans laquelle la page est écrite, le format de fichier que vous recherchez (pdf, word, etc.), la date de mise à jour du site, l'emplacement des termes recherchés dans la page (titre, corps de texte etc.). Vous pouvez aussi demander à Google de rechercher l'information dans un emplacement particulier, par exemple dans un site gouvernemental (gouv.qc.ca etc.). Dans ce cas, Google effectuera la recherche uniquement sur le site du Gouvernement du Québec.
Vous pouvez finalement effectuer une recherche de pages spécifiques. Vous pouvez rechercher les pages similaires à cette page (les pages similaires à www.communautique.qc.ca par exemple) ou encore les pages liées à cette page.
Contrairement à Altavista, le formulaire de saisie de Google ne présentent pas les opérateurs booléens (OR, AND, NOT, NEAR).
Site : la recherche s'effectue dans le domaine ou le site spécifié Exemple : site :www.communautique.qc.ca effectuera la recherche sur le site de Communautique uniquement.
Filetype : spécifie le type de document recherché (Word, pdf, Excel etc.) Exemple : communautique filetype:pdf cherchera uniquement les documents en version pdf contenant le terme Communautique.
Allintitle : recherche les termes dans le titre seulement de la page
Allintext : recherche les termes dans le corps du texte de la page
Allinurl : recherche dans l'adresse de la page
Allinanchor : recherche dans les liens de la page
Related : recherche les pages similaires à la page mentionnée
Link : cherche des pages contenant un hyperlien vers une page spécifique