استخراج کل url های یک صفحه از سایت برای موارد زیادی استفادهمی شود . ساخت نقشه سایت (sitemap) از آدرس url سایت یکی از اینموارد است . شما می توانید به راحتی همه url های یک صفحه را توسط php استخراج کنید . در این آموزش به شما کد php کوتاه و ساده برای استخراج کل url های یک صفحه توسط php ارایه دادیم.
کلاس DOMDocument در PHP کاربردهای سودمندی از جمله خواندن و نوشتن در فایل های xml و html را دارد. با کمک آن می توان فایل های xml و html را باز کرد و اطلاعات آن را پارس کرد. این کلاس به صورت پیش فرض در php موجود می باشد و نیازی به هیچ کاره اضافه برای کار با آن نمی باشد. همچنین DOMDocument خود نیز از کلاس DOMNode مشتق شده است.
کد php زیر به شما کمک می کند که کل لینک های یک صفحه وب را دریافت کنید. از تابع File_get_contents() برای دریافت محتویات یک صفحه وب از url یا یک فایل استفاده کردیم . اطلاعات دریافت شده از صفحه در متغییر $urlContent ذخیره می شود. تمام url ها یا لینک ها از صفحه وب html توسط کلاس DOMDocument استخراج می شود. همه لینک ها قبل از ذخیره شدن در متغیر توسط FILTER_VALIDATE_URL اعتبار سنجی می شوند.

خروجی :

امیدوارم این کد “استخراج کل url های یک صفحه توسط php” برای شما مفید بوده باشد.