Informations
Directeur de thèse :
Année de début :
Fin 2011
Université :
Université Constantine 2
Soutenance
Date de soutenance :
21 Janvier 2016
Membres de Jury :
Nacereddine Zarour
Allaoua Chaoui
Sihem Abbassen
Mohamed-Khireddine Kholladi
Okba Kazar
Manuscrit
Téléchargement : Référence :
DrLMD/NTIC/2015/004
Détails
Titre :
Agents adaptatifs et méta-heuristiques pour la recherche d’information personnalisée

Résumé :

Depuis l’avènement du Web, la Recherche d’Information (RI) s’est vue propulsée au premier plan et les moteurs de recherche ont vu le jour. Une des conséquences de cette évolution est que les méthodes classiques de la RI, surtout destinées à des recherches textuelles simples, se sont retrouvées face à une surabondance de documents de différents formats et des contenus riches. Ainsi les moteurs les plus connus indexent des milliers de milliards de pages, mais malheureusement ce sont des outils de recherche d’information génériques et visent à servir le plus grand nombre d’utilisateurs sans les prendre en charge dans le processus de recherche. D’un autre côté, l’utilisateur devient de plus en plus exigeant quant à la pertinence des résultats retournés mais il formule ses requêtes de façon courte et ambigüe ce qui donne des spécifications incomplètes et imprécises sur son besoin réel en information. La personnalisation de la RI tente de répondre à ces exigences en ayant pour objectif principal l’amélioration des résultats retournés à l’utilisateur en fonction de ses centres d’intérêt et de ses préférences.

Le présent travail présente une nouvelle approche de RI personnalisée capable d’intégrer l’utilisateur dans le processus de recherche. Nous avons orienté nos travaux vers un Système de Recherche d’Information Personnalisé (SRIP) qui, dans un premier temps permet de construire les centres d’intérêt de l’utilisateur pour mieux cerner son besoin en information, et ce en capturant ses jugements à propos des documents que lui retourne notre système. Ensuite, nous procédons à l’optimisation de ses requêtes en y réinjectant de la pertinence issue des centres d’intérêt déjà construits ; et ce en utilisant une méta-heuristique à base d’une population d’agents adaptatifs. Dans la phase d’optimisation de requêtes, nous avons opté dans un premier temps pour les algorithmes génétiques et ensuite nous avons choisi l’optimisation par essaims particulaires. Toujours dans la perspective de récupérer plus de résultats à partir du Web, nous avons aussi proposé un méta-moteur pour l’interrogation de plusieurs moteurs de recherche.


Mots clés :
Recherche d’information personnalisée Centres d’intérêts Réinjection de pertinence Agents adaptatifs Algorithmes génétiques Essaims particulaires Méta-moteur


Abstract:

Since the advent of the Web, Information Retrieval (IR) has been propelled to the forefront and search engines were born. One of the consequences of this development is that conventional IR methods, especially those destined for simple text search, faced a plethora of documents in various formats and with a rich content. So, the most famous search engines index trillions of pages, but unfortunately, they are generic IR tools and they intend to aim the largest number of users without considering them in the search process. On the other hand, the user becomes more exacting about the relevance of the returned results but he formulates briefly and ambiguously his queries giving incomplete and imprecise specifications of its real information needs. Personalized IR tries to address these requirements with the main objective of improving the results returned to the user based on his interests and preferences.

This work presents a new approach for Personalized IR capable of integrating the user in the search process. We oriented our work towards a Personalized Information Retrieval System (PIRS) which at first builds user interests to better understand his information needs, by capturing his judgments about documents returned by our system. Then, we optimize his queries by relevance feedback obtained from the interests already built. This optimization is performed using a meta-heuristic based on a population of adaptive agents. In the query optimization phase, we chose firstly genetic algorithms and then we used the particle swarm optimization. Also in the perspective of retrieving, more results from the Web, we proposed a meta-search engine for querying multiple search engines.


Keywords:
Personalized information retrieval Interests Relevance feedback Adaptive agents Genetic algorithms Particle swarm Meta-search engine


الملخص:

منذ ظهور شبكة الإنترنت، شهدت استرجاع المعلومات دفعة الى الواجهة وظهرت محركات البحث. إحدى نتائج هذا   وخاصة بالنسبة للأبحاث النصية البسيطة، وجدت نفسها أمام عدد، التطور هي أن الأساليب التقليدية لاسترجاع المعلومات كبير من الوثائق ذات أشكال مختلفة وبمحتوى جد غني. وهكذا محركات البحث الأكثر شهرة تفهرس تريليونات من   ولكن للأسف هي أدوات عامة لاسترجاع المعلومات وتهدف لخدمة أكبر عدد من المستخدمين دون، الصفحات على الويب أخذهم بعين الاعتبار خلال عملية البحث .من ناحية أخرى، أصبح المستخدم أكثر طلبا من حيث أهمية النتائج التي تم إرجاعها له لكنه يصوغ في نفس الوقت استفساراته بشكل قصير وغامض مما يعطي مواصفات ناقصة وغير دقيقة عن حاجته الحقيقية للمعلومات .تخصيص استرجاع المعلومات يحاول تلبية هذه المتطلبات حيث أن الهدف الرئيسي هو تحسين النتائج التي يتم إرجاعها إلى المستخدم استنادا إلى هواياته وأفضلياته.

يعرض هذا العمل منهجا جديدا لتخصيص استرجاع المعلومات قادر على دمج المستخدم في عملية البحث .لقد وجهنا   الذي ينشئ في البداية هوايات المستخدم لفهم أفضل لاحتياجاته من ، أعمالنا نحو نظام استرجاع المعلومات متخصص المعلومات، وهذا بالتقاط أحكامه على الوثائق التي يعودها له نظامنا .ثم نشرع في تحسين استفسارات المستخدم من خلال الإدخال عليها وثاقة الصلة بالموضوع المستخرجة من هواياته التي بنيت من قبل؛ هذا التحسين ينجز باستخدام ارشادي   اخترنا في البداية الخوارزميات الجينية ثم ، الفوقية المعتمد على وكلاء التكيف. وفي مرحلة تحسين استفسارات المستخدم اقترحنا محرك البحث، استخدمنا التحسين عن طريق أسراب الجسيمات. أيضا بهدف استرجاع المزيد من النتائج من الويب الفوقي لاستعلام العديد من محركات البحث.


الكلمات المفتاحية:
وكلاء التكيف ردود وثاقة الصلة بالموضوع هوايات المستخدم الكلمات الرئيسية: تخصيص استرجاع المعلومات الخوارزميات الجينية أسراب الجسيمات محرك البحث الفوقي