کرالر (Crawler) چیست؟
یک موتور کاوش مانند گوگل دارنده کرالر، ایندکس و الگوریتم میباشد. کرالر لینک و پیوند ها را دنبال می نماید. وقتی که کرالر، سایت شمارا پیدا نماید، آن را میخواند و محتوایش را ایندکس می نماید.
کرالر لینک و پیوند های یک تارنما را دنبال می نماید. کرالر همینطور ربات یا این که اسپایدر سئو در مشهد نامیده میگردد. در 24 ساعت 7 روز هفته آحاد وب را کاوش می نماید. وقتی که وارد یک وبسایت میگردد، ورژن HTML برگه را در یک مقر داده غول آسا ذخیره می نماید، که آن را ایندکس می نامند.
هر توشه که کرالر ها به داخل وبسایت شما میایند و ورژن آپ تو دیت گردیده آن را میبینند به روز می گردد. بسته بدین که چقدر وب سایت شما برای گوگل التفات دارااست و چه تعداد تغییر تحول در آن ساخت و ساز میکنید، کرالرها نادر یا این که زیاد به سراغ تان میایند.
امکان Crawl شدن چیست؟
امکان کرال شدن مرتبط با امکاناتی میباشد که گوگل برای Crawl کردن سایت شما داراست. کرالر ها میتوانند از طرف وبسایت شما بلاک شوند.
رویه های یه خرده برای بلاک کردن ربات ها وجود دارااست. درصورتی که تارنما یا این که ورقه ای از وب سایت شما بلاک گردیده باشد، به کرالر های گوگل میگویید: “اینجا نیاید”، در سود تارنما شما یا این که صفحه های مرتبط با وبسایت تان در حاصل جستجوی گوگل مشاهده نمیشود.
مواقعی برای پرهیز از گوگل برای Crawl کردن (یا این که ایندکس کردن) وبسایت تان وجود داراست:
درصورتیکه فولدر robots.txt کرالرها را بلاک نماید، گوگل به باطن وب سایت شما یا این که کاغذ خاصی مرتبط با آن نمی آید.
پیش از Crawl کردن وبسایت شما، کرالر ها نگاهی تحت عنوان HTTP تارنما می اندازند. این تیتر HTTP دارنده یک کد موقعیت میباشد. در صورتی این کد شرایط بگوید که ورقه نیست، گوگل تارنما را Crawl نمی نماید.
در صورتیکه ربات های تگ متا در یک برگه خاص موتور های کاوش از ایندکس کردن آن برگه بلاک نمایند، گوگل شیت را Crawl می نماید البته آن را ایندکس نمی نماید.
[ شنبه 1 ارديبهشت 1403 ] 12:21 ] [ محمد صادقی ]
[ ]