JavaScript Codes


mardi, janvier 23, 2007

Recherche Méthodique

En avril 2006, Harvest Digital a étudié la façon dont 205 internautes britanniques (utilisateurs de Internet depuis 3 ans et y passant plus de 10 heures par semaine) utilisaient les moteurs de recherche:
- Google est utilisé par 94% des internautes mais 76% des internautes utilisent plusieurs moteurs de recherche.
- 47% des personnes interrogées passent plus de 3 heures par semaine rien qu'en recherches
- 68% des internautes utilisent 3 mots clés ou plus pour exprimer leurs recherches
- Au niveau de leurs échecs de recherche, 36% des internautes les imputent à des mots clés qu’ils choisiraient mal. 32% estiment que l'information qu’ils recherchent est trop spécialisée. Seulement 8% pensent que cela pourrait être dû au moteur de recherche.
- 24% des internautes n'apprécient pas la présence de liens sponsorisés.
- L'étude a également demandé ce qui, d’après les internautes, pourrait améliorer leurs résultats : plus d'entraînement et d'expérience pour 50% des sondés, l'utilisation de plusieurs moteurs pour 9% et de meilleurs moteurs pour seulement 5%...
http://www.harvestdigital.com/fact_sheets.cfm
Nous allons essayer d'apporter une réponse à cette moitié des internautes qui demandent à améliorer leur compétence en recherche. Et le choix des mots-clés est évidemment le principal point critique…
Du questionnement aux réponses, tout un voyage!
Il y a tant de problèmes et tant de solutions, que le plus difficile est de se rappeler de ceux qui nous importent vraiment !
S'organiser pour ne pas se perdre dans notre voyage sur Internet: comme le Petit Poucet, garder des traces pour se rappeler de ses choix: Noter un mot ou l'autre, faire un schéma… Si on est interrompu, si on a suivi un chemin de traverse, si on revient quelques jours plus tard, les pages tracées de notre main ont souvent le pouvoir de nous ramener là où nous en étions dans notre réflexion.
Des logiciels comme Scrapbook ou NetSnippets apportent aussi une solution à celui qui veut organiser rapidement les informations recueillies et être en mesure de les republier facilement vers ses collègues: http://amb.vis.ne.jp/mozilla/scrapbook/, http://www.netsnippets.com/
Des services Internet comme http://del.icio.us/ permettent aussi de consigner ses résultats de recherche en les partageant avec d’autres Internautes.
Qu'est ce qu'un moteur de recherche sur Internet
Grâce à Internet, des millions d’auteurs rendent accessibles à tous des milliards de documents.
Des dizaines de "spiders" (ou « web crawlers ») parcourent inlassablement le Web, obtiennent les documents un à un et créent leur index (pour chaque mot apparaissant dans l’un ou l’autre document, quels sont les différents documents qui le contiennent ?). Certains « spiders » gardent une copie du document pour pouvoir le présenter même si l’original disparaît ou pour pouvoir analyser ce qui a changé entre deux passages.
Sur base du travail de leur « spider », les moteurs de recherche permettent à des centaines de millions d’internautes d'exploiter les index pour trouver les documents dont ils ont besoin.
Google exploiterait près de deux cent milles ordinateurs (mars 2006).

Des idées aux mots…
· L'auteur a des idées: il les transcrit par des enchaînements de mots (avec parfois aussi des images et même des sons), dans un ou plusieurs documents inter-reliés.
Ces documents sont relativement statiques: ils contiennent, en quelque sorte, des réponses préparées à l'avance.
L'information qui est retrouvée par les moteurs de recherche, c'est celle que le programme d'indexation ("spider") peut trouver en suivant les liens entre documents. En conséquence:
o ce qui n'est pas écrit n'est pas indexé,
o ce qui n’est pas déposé dans un serveur accessible de l’Internet n’est pas indexé,
o ce qui n'est pas lié au document « racine » d’un serveur, en un nombre limité d’étapes (ou directement par un document extérieur) n'est pas indexé,
o ce qui n’est pas accessible gratuitement n’est pas indexé.
Et tout ce qui n'est pas indexé n’est évidemment jamais trouvé par les moteurs de recherche…
· Quand on parle avec un spécialiste, celui-ci élabore une réponse en fonction des questions qui lui ont été posées. De la même manière, il y a des applications informatiques qui produisent dynamiquement des informations selon les données d'un problème qu'on leur soumet par formulaire.
C'est le Web "invisible", la partie du Web que les "spiders" ne peuvent pas indexer puisqu'ils ne connaissent pas les données des problèmes !
Des catalogues ont été dressés par différentes institutions pour trouver ces banques de données invisibles pour les "spiders".
o Dadi est un répertoire des banques de données gratuites: http://dadi.enssib.fr/
o GoshMe est un très bon outil pour chercher dans plusieurs banques de données "invisibles" et pour proposer celles qui semblent les plus pertinentes pour un ensemble de mots cherchés: http://www.goshme.com/
· L'internaute a des besoins mais ce qu'il cherche ce sont des solutions: quels sont les mots que les auteurs ont pu utiliser pour décrire des solutions aux besoins de l'internaute ?
· Entre les idées de l'auteur et les besoins de l'internaute, il y a:
o Les mots et la langue de l'auteur
o Les hypothèses, les axes de solution à ses besoins que l'internaute est capable d'imaginer
o La langue et les mots de l'internaute
Comment gérer cette fracture entre les auteurs et les internautes ?

Des mots aux idées…
Heureusement, l'internaute est dans un processus dynamique. Petit à petit, l'internaute peut améliorer la rédaction de ses requêtes de recherche en effectuant les étapes suivantes:
1. Rédiger une expression de son besoin (Quoi? Pour quoi? Qui? Pour qui? Comment? Où? Quand?)
2. Rassembler quelques documents qui parlent de son besoin et qui évoquent des axes de solution et s’imprégner des principaux concepts du domaine
3. Rédiger une expression pour chaque axe de solution possible
4. Pour chaque langue que l'on comprend, indépendamment, choisir de bons mots clés (la recherche terminologique)
5. Identifier des sources adéquates: auteurs, institutions, entreprises, banques de données ou sites spécialistes du problème à résoudre (navigation "horizontale" ; si nécessaire, chercher à atteindre le Web invisible en utilisant des moteurs de recherche spécialisés)
6. Trouver des documents qui apportent l'un ou l'autre élément de réponse au besoin (la stratégie de recherche documentaire)
Une recherche sur Internet, c'est donc un tout un processus dont on a intérêt à conserver les différents éléments dans un dossier.
Nous ne connaissons pas de logiciel qui appuie spécifiquement l'enchaînement de ces étapes mais Scrapbook, NetSnippets ou Del.icio.us sont une base qu’il faudrait compléter avec des outils terminologiques.
On ajuste évidemment la rigueur dans le suivi de cette méthode selon l’importance et la difficulté de sa recherche.



Choisir de bons mots-clés ?
C'est la clé ! Mais on se confronte à trois niveaux de problèmes dont on doit être profondément conscient pour pouvoir les surmonter:
1. Le niveau sémantique
L'information permet les décisions et les décisions permettent l'action.La valeur des informations est celle des actions qu’elles déclenchent.
C'est dans ce cadre, qui part de la volonté d'action, qui passe par la prise de décisions, que se trouve la motivation de vos recherches sur Internet.
Le niveau sémantique est donc le choix des concepts et surtout des combinaisons de concepts à l'intersection (ET / AND) desquels se trouvent les informations désirées.
La stratégie de recherche documentaire expliquée dans ce document suit cette approche.
C’est assez paradoxal mais, souvent, on ne sait pas vraiment ce qu'on cherche !On ressent un besoin, on pressent des solutions et c’est dans la confrontation avec ce qui existe (avec ce qu’on voit sur Internet) que les choses se précisent.La « promenade » est parfois plus féconde que la « recherche »…
2. Le niveau terminologique
Pour chaque concept, le choix des termes (un terme étant formé d’un ou de plusieurs mots) est ensuite critique comme expliqué un peu plus loin. Il faut essayer de ne pas oublier des termes possibles pour le concept que l'on désire trouver: on voudra alors trouver des variantes orthographiques, des synonymes, des traductions dans d’autres langues que l’on comprend. On s’aidera de glossaires, de dictionnaires, de textes explicatifs, etc.
On trouve assez facilement des documents avec les termes que l’on utilise soi-même. Le défi est de trouver ceux avec les termes que d'autres utilisent pour le même concept.
3. Le niveau lexical
Ce niveau est le plus technique et peut jouer de mauvais tours car les moteurs de recherche ne donnent pas tous les outils nécessaires pour les problèmes que l'on peut rencontrer à ce niveau. Mentionnons:
- la frontière entre les mots: où commencent-ils, où finissent-ils ? pipe-line ou pipeline ? H2O ou H 2 O ?
- l'allemand et le néerlandais permettent de réunir plusieurs mots en un seul
- les alphabets différents d'une langue à une autre: un même nom propre peut être orthographié différemment dans l'alphabet arabe, cyrillique ou japonais
- les accents: "The" vs "thé", "de" vs "dé", "poisson sale" vs "poisson salé", etc.
La ponctuation qui n'a pas d'importance SAUF dans les nombres (ponctuation différente entre l'Amérique et le Système International), dans les formules chimiques, en musique, etc.