|
Aide-Afrique.com Aide solidaire et gratuite pour l'Afrique francophone |
|
| Aide-Afrique.com > Education > Bourse d'étude |
Bourse d'étude troisième cycle en informatique
AIDE A LA DECISION PAR SEGMENTATION : APPLICATION A l’EXTRACTION DES CONNAISSANCES DANS L’ASSURANCE QUALITE DES PRODUITS ALIMENTAIRES. Cas de l’Office Congolais de Contrôle
Par Marie-Alice Tshiela Nkuna 1. Problématique et Hypothèse 1.1. Problématique Le problème spécifique que se pose notre travail est celui du traitement des données accumulées en entrepôt par l’Office Congolais de Contrôle (OCC) pour en extraire les connaissances utiles à la prise de bonnes décisions dans son activité d’assurer la conformité et la qualité des denrées alimentaires à l’importation pour la consommation de la population. Face à la mondialisation et à plusieurs d’autres facteurs économiques, la prise de décision est devenue indispensable pour les institutions de l’état comme elle en est pour les dirigeants d’entreprises. L'efficacité de cette prise de décision repose sur la mise à disposition d'informations pertinentes et d'outils adaptés. Le problème est d'exploiter efficacement d'importants volumes d'informations, provenant soit de leurs systèmes opérationnels, soit de leur environnement extérieur, pour supporter la prise de décision. Les systèmes traditionnels s'avèrent inadaptés à une telle activité et des systèmes décisionnels ont été développés dans le but de pallier cet inconvénient. La plupart de ces systèmes reposent sur un espace de stockage centralisé, appelé entrepôt de données (Data Warehouse), qui a pour rôle l'intégration et le stockage de l'information utile aux décideurs et la conservation de l'historique des données pour supporter la fouille de données effectuées lors des prises de décision. La fouille de données englobe quant à elle un ensemble de techniques et méthodes d’analyse parmi lesquelles se trouve la segmentation qui consiste à créer une partition ou une décomposition d’un ensemble quelconque de données en groupes telle que : - les données appartenant au même groupe se ressemblent ; - les données appartenant à deux groupes différents soient peu ressemblantes. La plupart d’institutions d’Etat de notre pays prennent avec peine des grandes décisions qui impliquent l’ensemble des populations et qui concernent des questions de vie ou de mort ignorant qu’il existe de nos jours des outils qui proposent divers solutions de conception et de développement des systèmes décisionnels. Notre objectif est donc d'apporter des solutions nouvelles pour la prise des décisions dans les institutions d’Etat de notre pays et plus précisément à l’Office Congolaise de Contrôle de la ville de Kananga dans le souci de rendre efficace ses dispositions à prendre dans le processus de l’assurance qualité des denrées alimentaires à l’importation. Face à la profusion d'informations hétérogènes dans cette institution, la conception et le développement de systèmes décisionnels adaptés s'avèrent primordiaux. 1.2. Hypothèse La technique adaptée à la prise en charge de cette problématique est la segmentation. Cette technique fournit des éléments pertinents pour démontrer la performance et la pertinence de la segmentation de denrées alimentaire propre à la consommation pour l’aide à la prise de décision. Notre hypothèse de travail est donc que la technique de segmentation, qui consiste à segmenter les produits hétérogènes en sous-ensembles homogènes, est l’outil le plus pertinent et le plus performant parmi les techniques de Data Mining pour l’extraction de données utiles à la bonne prise de décision. Considérons un ensemble X de produits caractérisés par P variable. Soit X (i,j), la valeur prise par produit i à la Jième variable. Il s’agit de réaliser comment segmenter X en K classes homogènes et affecter un nouveau produit à sa classe sans relancer la classification dans sa totalité. 2. Choix du sujet et Intérêt scientifique 2.1. Justification du choix Face au danger que représente si souvent la consommation par notre population de produits à l’importation mal contrôlés par les services d’Etat responsables, notre travail de thèse se veut une contribution à l’amélioration du travail de traitement par l’Office Congolais de Contrôle/succursale de Kananga, des denrées alimentaires importées dans le pays. La gestion de la situation par la technique informatique de segmentation est une des modalités qui permettent de bien protéger en amont la santé de la population consommatrice en ne lui offrant que des denrées alimentaires de bonne qualité. 2.2. Intérêt scientifique - Intérêt de l’Utilisateur L’intérêt de ce sujet de thèse réside dans le souci de protéger la santé de la population en ne lui offrant que des denrées alimentaires importées de meilleure qualité en lui proposant de moyen pouvant améliorer d’avantage son contrôle. - Intérêt pour l’auteur Recenser les diverses méthodes d’analyse de données relevant du Data Mining et apporter une contribution originale et scientifique dans ce domaine en proposant la segmentation à niveaux. Après l’obtention de l’arbre, couper celui-ci pour former des classes. Définir d’autres critères dans ces classes en vue de former des sous-classes - Intérêt pour la science Ce travail veut se proposer en modèle pour tout chercheur soucieux d’approfondir ses connaissances dans les techniques de Data Mining, plus précisément la technique de segmentation. Cette technique s’appliquera sur les denrées alimentaires importées en vue de déterminer un pourcentage requis de qualité qui aidera les responsables à la prise d’une meilleure décision. 2.3. Etat de la Question En effet, Mrs Bruno Agard, Stéphane Deveault, ont appliqué la segmentation aux différentes techniques de marketing , tandis que Mrs F. Saadi, D. Meddour, ont traité de la segmentation multiéchelle d’images vidéo par la modélisation markovienne. Ils présentent une technique de segmentation spatiale d’images vidéo ; et cette technique a permis d’assurer une convergence rapide vers la solution optimale en obtenant des frontières similaires et en éliminant le problème du nombre initiale de région . Pour leur part Mrs. Johan Baltié, Franck Coppola, Tristan Robert ont abordé la question de la segmentation et Data Mining pour industrie le but ayant été d’une part de découper une base de données en sous-ensembles consistants et, d’autre part, de trouver les règles qui régissent cette base de données. Nous aussi, dans notre thèse, nous allons aborder les techniques de Data Mining en insistant sur la technique de segmentation de denrées alimentaires De ce qui précède il s’agit de segmenter les produits en classes en mettant l’accent sur la qualité des denrées alimentaires à l’importation, sur lesquelles sera basé l’outil d’interrogation et le processus d’aide à la décision à prendre par l’Office Congolais de Contrôle, succursale de Kananga, avec une application en C#. C’est ce qui fera l’originalité de notre recherche. 2.4. Objectif du travail Notre travail veut atteindre trois objectifs. Nous voulons arriver à : - Concevoir un classifier automatique par segmentation pour l’analyse de données complexes ; - Mettre au point des algorithmes avec une complexité améliorée ; - Mettre au point un système décisionnel sur la logique d’extraction de connaissances et le comportement de consommateurs 3. Programme Méthodologique Pour atteindre nos objectifs, notre thèse sera structurée en deux grandes parties : - La première partie portera sur les considérations théoriques sur la pertinence de la technique de segmentation dans le Data Mining - La deuxième partie traitera du processus de mise en place d’un système d’aide à la décision, ainsi que l’analyse des résultats. Ainsi le plan de notre thèse se schématisera de la manière suivant. Hormis l’introduction générale et la conclusion générale : • La première partie s’étalera sur trois chapitres : - Le premier chapitre portera sur les entrepôts de données expliquera les concepts fondamentaux de ce que nous appelons entrepôts de données ; nous expliquerons les termes dimensions et faits, la conception des entrepôts et le cube ou hyper cubes de données ; - Le deuxième chapitre expliquera le concept Data Mining et ses différentes méthodes et techniques comme outils d’aide à l’extraction de connaissances : les avantages et les inconvénients de chaque méthode, et le pourquoi de notre choix de la segmentation comme meilleure technique d’aide à la prise de décision ; - Le troisième chapitre détaillera le système d’aide à la décision en trois grands points, à savoir : l’historique, l’informatique décisionnelle et l’architecture du système décisionnel; • La deuxième partie comportera les quatre chapitres suivants : - Le quatrième chapitre abordera la connaissance du système d’information (OCC) et la conception de l’entrepôt ; - Le cinquième chapitre se penchera sur l’analyse discriminante (classification). Au cours de ce chapitre nous traiterons de l’analyse discriminante et de la technique de segmentation par l’arbre de décision ; - Le sixième chapitre s’intitulera l’assurance qualité des denrées alimentaires pour une bonne prise de décision; c’est au cours de ce chapitre que nous allons décrire le processus d’analyse des différents échantillons représentatifs en termes de pourcentage concernant la qualité du produit, en nous référant à notre cible d’étude qui est l’OCC dans sa division d’Exploitation et service de Laboratoire ; - Le septième chapitre abordera l’analyse et l’interprétation des résultats. 4. Méthodes et Techniques Dans le cadre de l’élaboration de ce travail, nous aurons recours à quelques méthodes et techniques identifiées : 4.1. Méthodes : - La méthode historique ou descriptive nous permettra de présenter l’histoire de l’Office Congolais de Contrôle, en sigle OCC ; - La méthode structuro-fonctionnelle nous permettra de prendre connaissance de la structure et le fonctionnement de l’Office Congolais de Contrôle ; - La méthode analytique, nous permettra de connaitre l’organisation de chaque service surtout la division d’Exploitation ainsi que le service de laboratoire, notre cible. 4.2. Techniques : - La technique documentaire nous permettra d’élaborer notre approche théorique en consultant les différents ouvrages, thèses de doctorat, Mémoire, Travaux de Fin de cycle, articles, ainsi que la bibliothèque numérique qui cadrent avec notre sujet et domaine de recherche ; - La technique d’interview nous aidera à obtenir des informations fiables auprès des personnes œuvrant dans la division d’Exploitation et service laboratoire de l’Office Congolais de Contrôle ; - La technique d’enquête, nous permettra de constituer un questionnaire en vue d’obtenir auprès d’un échantillon représentatif les informations liées aux moyens de conservation et aux procédures pour déclarer la conformité et la bonne qualité des denrées alimentaires importées à l’OCC. 5. Délimitation du sujet Parler de l’Informatique décisionnelle et de la performance de l’entreprise, est un sujet de grande portée. Nous allons le circonscrire dans l’espace et dans le temps de la manière qui suit: - Dans l’espace, notre étude se focalisera dans la division d’Exploitation et service laboratoire de l’Office Congolais de Contrôle succursale de Kananga, notre cible d’exploration ; il calcule et garantit la conformité et la qualité de denrées alimentaires à l’importation que la population pourra consommer sans porter préjudice à sa santé ; - Dans le temps, nous analyserons les données de l’OCC de la période allant de janvier 2008 à janvier 2013 donc, sur une période de cinq ans. 6. Eléments Bibliographiques 6.1. Ouvrages 1. ANNE LUPFER, Gestion des risques en sécurité de l’information « mise en œuvre de la norme ISO 27005 ». Edition Eyrolles, Paris 2010. 2. BENZECRI, J.P., L’analyse des données : la taxonomie. Tome A. Edition Dunod, Paris, 1973. 3. BERTRAND BURQUIER, Business Intelligence avec SQL Server 2008. Edition Dunod, Paris 2009. 4. CELEUX G., DIDAYE E., LECHEVALIERY, GOVAERT G. et RALAMBOMDRAINY H., Classification automatique des données. Edition Dunod, Paris, 1999. 5. CHRISTOPHE HARO, Algorithme, « raisonner pour concevoir ». Edition Eyrolles, Paris 2009. 6. DIDAYE, LEMINAIRE J., PAUGET J., TESTW F., Eléments d’analyse de données. Edition Dunod, Paris, 1982. 7. EROL GELENBE et GUY PUJOLLE, Introduction aux réseaux de files d’attente, Edition Eyrolles, Paris, 1982. 8. FRANCO, J.M., Le Data Warahouse, le Data Mining. Edition Eyrolles, Paris, 1997. 9. FRANCO, J.-M. et LIGNEROLLE, S. , Piloter l’entreprise grâce au Data Warehouse. Edition Eyrolles, Paris, 1997. 10. JAMBOU M, ODILE M.LEBEAUX. Classification automatique pour l’analyse des données : méthodes et algorithmes. Edition Dunod, Paris, 1978. 11. JAMBU, M., Introduction au Data Mining. Edition Eyrolles, Paris, 2006. 12. ABADI, M., La Sécurité Informatique. Editeur, Fayard, collège de France, 2011. 13. GONDRAN, M., et MINOUX, M., Graphes et Algorithmes. Edition Eyrolles, Paris, 1979. 14. KIMBALL R., Entrepôts de données Guide pratique du concepteur de Data Warehouse. Edition Eyrolles, Paris, 1997. 15. KIMBALL R., REEVES, L., ROSS, M., THORTHWAITE, W., Concevoir et déployer un Data Werahouse « Guide de conduite de projet. Edition Eyrolles, Paris, 1997. 16. POMEROL J-Charles, Les Systèmes Experts. Edition Hermès, Paris, 1988. 17. TUFFERY S., Data Mining et statistique décisionnelle, intelligence dans les bases des données. Edition TECHNIP, Paris, 2005. 18. LEFEBURE René et VENTRI Gilles, Le Data Minig. Edition Eyrolles, Paris, 1998. 19. SANDOVAL V., L’informatique décisionnelle. Edition Hermès, Paris, 1997. 20. WINKLER V., La Sécurité dans le Cloud, « techniques pour une informatique en nuage sécurisée. Edition Pearson Education, Paris, 2011. 21. ZIGHED, D. A. and R. RAKOTOMALATA., Graphes d’introduction, apprentissage et Data Mining. Edition Hermès, Paris, 2000. 6.2. Articles 1. ALI KHENCHAF, « Systèmes d’information pour l’aide à la décision en ingénierie système », In RNTI-E8, Editeur Cépaduès, Paris, 2006. 2. BREMAUD P., « Files d’attente et réseaux », ENSTA, 1988. Et RUEGG A., Processus stochastiques avec application aux phénomènes d’attente et de fiabilité, Edition Presses Polytechniques Romandes, 1989. 3. Collectif RNTI, « Entrepôts de données et analyse » en ligne – EDA’10, RNTI-B6., Auteur(s), Editeur Cépaduès, 2010. CollectifRNTI, Fouille de données d’opinions, In RNTI n° E-17, Editeur, Cépaduès, 2009. 4. FRANCK RAVAT, O. TESTE, G. ZURFLUH, « Modélisation et extraction de données pour un entrepôt objet », Université Paul Sabatier (Toulouse III), In IRIT (Institut de Recherche en Informatique de Toulouse), équipe SIG, Toulouse, France 2001. 5. GHATTAS, B., « Agrégation d’arbres de classification ». In Revue de Statistiques Appliquée 48(2), 85-98, 2000. 6. INMON W. H., The Data Warehouse and Data Mining, communication of the ACM., Vol. 39, n°11, nov. 1996. 7. OMAR BOUSSAID, PIERRE GANCARSKI, BRIGITTE TROUSSE, collectif RNTI, Fouille de données complexes : avancées récentes. In Revue RTNI-E-18, Editeur Cépaduès, 15 fév. 2010. 8. SEBATIEN FANTINI, Business Intelligence avec Sharepoint Server 2010, « créez un portail décisionnel et piloter la performance », Editeur Eni, 2011. 9. SADOK BEN YAHIA, PETIT, J-M., Collectif Cépaduès, « Extraction et gestion des connaissances » EGC’2010, revue des nouvelles technologies de l’information- In RNTI-E-19, Editeur Cépaduès, 2010. 6.3. Mémoires et Thèses 1. BENCHERKH Y., Classification automatique et modèles. Thèse de Doctorat, Université de Metz, Paris, 1992. 2. GEORGES El Helou et CHARBEL Abou Khalil, Data Mining, Techniques d’extraction des connaissances, éd. Des Université, Paris, 2004. (Mémoire) 3. JOLLOIS FRANCOIS-XAVIER, Contribution de la classification automatique à la fouille de données. Thèse de Doctorat, Université de Metz, 2003. (Thèse) 4. TESTE O, Modélisation et Manipulation d’Entreprise de Données Complexes et Historisées. Thèse de doctorat de l’Université Paul Sabatier, Décembre 2000. (Thèse) 6.4. Web graphie Facteurs importants à l’exécution du Data Mining. WWW.darminmag.com (consulté le 26 mai 2015) ; 2. Extraction de connaissances à partir de données. www.megaputer.com 3. WWW.darminmag.com ( consulté le 26 mai 2015) ; 4. www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining (idem) 5. www.reportingbusiness.fr, (consulté le 10 juillet 2015 à 20h00’) ; 6. www.infoentrepreneurs.org, (consulté le 10 février 2013 à 19h10’) ; N.B. : Ce projet a été défendu le 23 mai 2013. Et actualisé en août 2015 (devant le titulaire du cours et apprenants en DEA-U.KA) ANNEXE : Calendrier de Travail personnalisé (ce calendrier est sujet à des modifications) Année Tâches Modification 2014 - Novembre 2014 : Choix et formulation du sujet de Thèse - Décembre 2014 : Sujet de DEA et plan du mémoire 2015 - Avril 2015 : 1ère Rédaction des chapitres de DEA - Mai 2015 : 2ème Rédaction et Correction - Juin-Juillet 2015 : Dernière rédaction et contact avec le promoteur, fin de rédaction du dernier chapitre - Aout 2015 : dernière correction du texte, dernière visite du promoteur - Décembre 2015 : feu vert et dactylographie du mémoire 2016 - avril 2016 : dépôt du mémoire DEA et défense - Mai 2016 : Réorganisation du format de Thèse. - Juin : poursuite de, chapitres rédaction de Thèse - juillet : 2ème rédaction de la Thèse - Août : l’état d’avancement de la rédaction avec le promoteur 2017 - Janv. : poursuite de la rédaction de chapitres de Thèse - Mai : dernière rédaction et correction - Juillet : dernier contact avec le promoteur - Nov. : préparation de la monographie 2018 - 21 Février : Dépôt de la Thèse auprès du jury - 12 Avril : défense publique - Octobre : mise en valeur et publication de la Thèse. Kananga, le 1 mars 2016. C.T.- Marie-Alice Tshiela Nkuna, Candidate.- Vu et approuvé par : Prof. MANYA Ndjadi Léonard. Promoteur Vous aimez cette page ? Partagez-la !
Mon message
En respectant les règles, je participe librement et gratuitement à cette discussion :
Discussions similaires
Demandes similaires
|
Quelle est votre demande ?
|
||
|
|
|||