UA=CCBot/2.0
2013-05-26 à 03:38:06

Une mini-librairie/bibliothèque d'expressions régulières pour PHP

Nos missions dans le cadre des technologies web nous poussent à améliorer notre propre framework web de manière régulière, Vae Soli! pour ne pas le nommer. Nous développons donc plusieurs nouveautés comme par exemple cet indexer qui permet d'extraire par crawling l'ensemble des mots d'une page afin d'analyse taxonomique.

Nous retrouvant dans un développement qui ouvre la porte à de nombreuses utilisations, comme par exemple un moteur de recherche propre à notre framework, nous avons tout de suite imaginé une utilisation intéressante de notre concept de crawling dans le cadre de l'optimisation d'une page pour les moteurs de recherche tels que Google, Yahoo ou Bing. Ainsi est né le développement de notre moteur d'analyse de page, le Vae Soli! Analyzer, dont l'objectif est de comprendre une page, d'en extraire les mots les plus utilisés, d'en déduire le sujet général, et, au passage, de fournir des conseils d'optimisation en se basant sur des ratios de couverture du cœur de la page par rapport à son titre.

Cette analyse détaillée d'une page nous a mené à créer un ensemble d'expressions régulières (regex) de parsing de page HTML. Sans chichis, nous vous livrons les expressions régulières de notre propre code, pour que vous puissiez en faire usage dans vos propres développements : vous avez le droit d'utiliser toutes les expressions régulières publiées sur cette page dans le respect de la licence Creative Commons - Attribution 3.0 non transposé (CC BY 3.0).