mardi, mai 31

Moteur de recherche européen?

J'ai été invité par BFM à un débat avec Jean-Noel Jeanneney le 15 Juin à l'occasion de la fête de l'Internet. Malheureusement le même jour je dois participer à Genève à une réunion du chapître alpin d'une association d'entrepreneurs à laquelle j'appartiens ( www.YPO.org). Dommage, j'aurais volontiers fait part de mon scepticisme sur les déclarations répétées de JN Jeanneney, Président de la Biblothèque Nationale de France (BNF), au sujet du 'moteur de recherche européen' qu'il appelle de ses voeux. Lorsque j'ai lu les premières déclarations de JN Jeanneney sur le sujet dans Le Monde, je dois vous dire que j'ai carrement éclaté de rire tant le propos me paraissait décalé par rapport aux réalités de l'Internet. Ce monsieur annonçait carrément qu'il allait, avec le soutien des pouvoirs publics, construire un moteur de recherche capable de concurrencer Google. L'origine de cette affaire c'est le projet Google Print: Google a proposé aux principales bibliothèques mondiales de numériser les livres pour en rendre le contenu accessible via son moteur de recherche. Les principales bibliothèques anglo-saxonnes ont adhéré au projet avec enthousisame: Harvard, Stanford, Oxford...mais voilà que la BNF et Jean-Noel Jeanneney, loin d'accueillir l'idée favorablement, crient à l'hégémonie culturelle américaine et annoncent vouloir créer un système concurrent. Oui, vous avez bien lu: il s'agit non seulement de numériser les livres français indépendamment de Google, mais de créer de toutes pièces un moteur de recherche concurrent, qui indexera les bouquins français mieux que ces américains suspectés par nos dirigeants et grands experts d'Internet d'avoir un biais américain dans leurs algorythmes parce qu'ils sont écrits par des américains. Depuis le premier article du Monde, le Président français - dont la réputation de connaisseur de l'informatique n'est plus à faire - a repris l'idée, embarqué le chancelier allemand dans l'aventure et annoncé des fonds publics...on en est déja à 32 millions d'euros toujours selon Le Monde qui poursuit son lobbying actif en faveur de ce projet (encore dans l'édition d'hier). J'aurais donc volontiers posé la question suivante à JN Jeanneney: combien lui et ses amis sont-ils prêts à dépenser avant de revenir sur terre? 32 millions d'euros, c'est beaucoup d'argent, mais Google n'est pas seulement le moteur de recherche préféré de centaines de millions d'internautes. C'est une société qui génère des profits considérables et ses investissement se comptent en milliards de dollars! Jean-Noel Jeanneney croit-il sérieusement, et Le Monde avec lui, que quelques dizaines de millions d'euros vont suffire pour construire un moteur meilleur que Google, car s'il n'est pas meilleur -et pas seulement pour les recherches littéraires mais pour toutes les recherches- évidemment les internautes ne l'utiliseront pas... Il est d'ores et déja clair, à mon avis, que les pouvoirs publics français et européens n'ont ni les moyens ni l'intention d'investir les centaines de millions d'euros qui seraient éventuellement nécessaires pour donner un début de réalité au projet. Cela sans aucune garantie de succès car l'histoire des investissements publics dans la technologie montre amplement l'incapacité des administrations à concurrencer des sociétés privées, plus réactives, plus innovantes, plus motivées. Le gouffre financier qu'a été Bull devrait rendre les énarques plus prudents dans la dilapidation de l'argent des contribuables français! S'il y a un jour un moteur de recherche européen, capable de convaincre les internautes d'abandonner Google, il sera créé par des inventeurs de génie au sein d'une société privée, certainement pas au sein d'une administration. Alors Monsieur Jeanneney utilisez l'argent public pour numériser les livres (en mode texte indexable, pas en mode image svp) et non pour financer je ne sais quels développements sans queue ni tête. ...et si Google n'est pas assez coopératif pour indexer convenablement les livres en français, son concurrent Yahoo que je connais bien devrait être heureux de le faire pour offrir aux internautes français un meilleur service que son concurrent. Je suis sûr que mon ami Dominique Vidal qui dirige Yahoo Europe sera ravi d'en discuter avec vous.

Comments:
mais Pierre, Yahoo! n'est elle pas également une méchante société américaine.. ??

Sinon, je viens de découvrir le béta du fameux Google print : au delà du versant culturel du projet (alibi ?), c'est un formidable nouvel outil de marketing pour le monde de l'édition... une fois de plus Google prouve sa capacité à mettre en face une offre (le livre) et une demande (le mot clé)... les éditeurs sont d'ores et déjà invités à mettre leur catalogue en ligne directement (ça me rappelle les moteurs de shopping...)... sacrée innovation dans le monde de l'affiliation pour ce secteur (danger pour Amazon ?)...

Deux bémols en forme de questions pour finir le commentaire :
- le service saura t il gérer le "bruit" ? (j'ai fait des recherches très efficaces sur des mots clés "pointus" et des noms propres, mais je n'ai pas essayé "economy" ou "travel"...)
- do you speak English ?
 
Il va être difficile d'éviter de pactiser avec un moteur américain, ne serait-ce parce qu'il n'y en a pas beaucoup de non-américains.

Je ne reviens pas sur la pertinence technique et économique de ce projet : tu as tout dit.

Sur le combat Americano - Européen, je pense que les racines de Google et de Yahoo sont aux US, mais que ce sont avant tout des boites mondiales et que leurs gouvernances pilotent pour leurs objectifs et non ceux de la Maison Blanche. Comparé au reste du monde, les US ne sont qu'un marché de plus (un gros et attractif, mais il y en a d'autres...).

Le projet d'un moteur propriétaire retardera juste un peu plus l'échéance. Je crois pour ma part que les initiateurs parient sur le contenu exclusif de leur concept (Si tu veux mes archives, tu ne peux les trouver que chez moi), difficulté d'accès qui est le meilleur moyen de marginaliser la culture européenne.
 
Effectivement Amazon doit regarder de près ces développements, d'ailleurs ils sont actifs sur le sujet à leur manière(A9.com)

A part ça qui sait comment faire pour activer un fil rss sur Blogger? merci d'avance.
 
Eh oui, quand nos élites politiques se mettent à parler entreprise....
 
Faudra bien die que les Francais peuvent faire un impact sans ses institutions, tu connait Exalead?

http://searchenginewatch.com/searchday/article.php/3507266

reGARDs :-)
 
oui je connais exalead et je ne pense pas que c'est le futur tombeur de google ;-)
 
Je souhaite réagir sur ce que tu dit un peu plus haut, à savoir (je cite) : "Oui, vous avez bien lu: il s'agit non seulement de numériser les livres français indépendamment de Google, mais de créer de toutes pièces un moteur de recherche concurrent, qui indexera les bouquins français mieux que ces américains suspectés par nos dirigeants et grands experts d'Internet d'avoir un biais américain dans leurs algorythmes parce qu'ils sont écrits par des américains." Même si je reconnais que l'article était d'une naiveté déconcertante, d'une arrogance typiquement Française et teintée d'anti-américanisme, je pense qu'il à raison lorsqu'il affirme que la sélection des ouvrages sera biaisée. Non pas à cause d'une volonté consciente et impérialiste américaine, mais en raison de la culture des décideurs qui choisiront QUOI scanner et dans quel ordre de priorité...cette culture sera forcément américaine et nous en ferions de même : il y a fort à parier que "les Misérables" de V. Hugo seraient accessibles avant "Les Raisins de la colère" de Steinbeck si Google était français. Je pense donc qu'il a raison d'affirmer que ce projet va fortement rendre accessible au monde des pans entiers de culture américaine, des modes de pensée américains, ce qui n'est pas forcément un mal, et ce n'est pas demain que l'on contrera cela... surtout avec une volonté dirigiste et des fonds publiques comme tu le soulignes bien.
 
Je suis d'accord sur le point que les américains vont d'abord penser à scanner les contenus des bibliothèques anglo-saxonnes... c'est d'ailleurs ce qu'a annoncé Google et ce qui a suscité l'ire de JN Jeanneney et sans doute la sympathie de Chirac and Co pour son projet.

Mais plutôt que de dépenser l'argent public en essayant de lancer un moteur concurrent de Google et Yahoo, ce qui est comme tu l'écris d'un "arrogance typiquement française" et j'ajouterai "typiquement énarque", la France et l'Europe pourraient pragmatiquement dépenser leurs soo pour SCANNER LES LIVRES du vieux continent et les soumettre aux robots indexeurs de Google...et Yahoo.

Je suis sûr qu'ils se feraient alors concurrence pour être le premier à référencer ce contenu, avoir ainsi un meilleur service en Europe et prendre l'avantage sur le concurrent.

Donc en résumé: on scanne les livres, ils les indexent.

JN Jeanneney et "Le Monde" se trompent quand ils semblent croire:
1/qu'il y aurait un biais "américain" dans l'algorythme de ces deux moteurs alors qu'à partir du moment où le contenu des livres de toutes les langues est numérisé et indexé il ressortira parfaitement. Penser qu'il pourrait y avoir un tel biais dans l'ALGORYTHME c'est un peu comme croire que Windows et Word ne permettent pas d'écrire en français correctement!
2/qu'il y a la moindre chance de construire un moteur "Public" de recherche capable d'attirer une audience non ridicule.

Nous devrions être d'accord là-dessus?
 
C'est effectivement le chemin qui me semble également le plus simple et le plus court... quitte à négocier ensuite avec le challenger des 2 un accord plus astucieux, teinté, par exemple, de marque blanche pour les bibliothèques universitaires.
 
Mon avis sur la question :
http://s.billard.free.fr/referencement/index.php?2005/02/04/32-google-defierait-leurope
http://s.billard.free.fr/referencement/index.php?2005/02/21/44-si-m-jeanneney-mentend

Personnellement je ne crois pas à un "machin" public, qui sera à priori lourd et inefficace. Je pense que la solution la plus simple serait la meilleure : des textes indexables par tous les moteurs de recherche actuels. Nul besoin de créer un moteur dédié. Et une licence libre pour que l'information soit diffusée facilement.
 
Encore une fois, en France on essaye de faire compliqué et cher alors que la solution est d'une "simplicité" et d'une logique extreme: scannons les textes qui seront indexables par tous les moteurs de recherche actuels.

Euh, est ce que quelqu'un auras assez de patience et de pouvoir pour le leur faire comprendre la-haut :-) ??
 
Bonjour,

Vous dites que Exalead ne sera pas le futur tombeur de google, pouvez-vous préciser les raisons qui vous font dire cela?

Leur outil me parait intéressant, il leur manque juste un peu de renommée. Concernant les moteurs cela est essentiel pour percer.

Par ailleurs, pour répondre à un autre post, Google est loin d'être une simple société privée indépendante, des membres de la direction sont des proches de certains "faucons" conservateurs...
 
Bonjour Pierre,

ça fait quelques temps que je m'interesse à vos exploits, et cela me chagrine de voir que malgrè votre histoire vous ayez aussi peu confiance en nos chercheurs...

Je ne dis pas qu'exalead est près à conquérir le monde mais leur approche permettant d'affiner une requête au fur et à mesure est je pense assez intéressante.

Vous parlez souvent de l'algorithme (avec un I svp) de Google. Sachez que leur algorithme PageRank n'est pas le plus efficace. Je vous citerai seulement quelques propositions d'un collègue: BackRank, FlowRank, BlowRank...(mémoire de thèse de Fabien Mathieu)

En ce qui concerne un moteur de recherche, sachez également que l'algorithme ne fait pas tout. Il existe 2 autres points importants pour faire un bon moteur:
- le crawl, c.à.d. l'étape qui consiste à télécharger des pages du web avant de les indexer.
- la structure de donnée qui permet de stocker l'indexe permettant de retourner rapidement la réponse à une requête.

L'approche d'exalead traite efficacement le second point. Pour le premier point nos chercheurs travaillent sur de nouvelles approches assez interessantes.

La principale force de Google est d'avoir réussi à se placer à "l'entrée" du web, ce qui est actuellement la meilleure place... j'ai bien noté ACTUELLEMENT!

Si vous êtes toujours intéressé par les (grosses) affaires, j'aimerais m'entrenir avec vous d'un projet d'avenir passionnant, qui s'inscrit dans votre vision d'avenir sur le web (en particulier sur le web 2.0), mais qui voit plus loin... beaucoup plus loin!

mon email est accessible sur ma page web.

@++
anh-tuan
 
Enregistrer un commentaire



<< Home

This page is powered by Blogger. Isn't yours?