جلوگیری از خزش سایت با کمک robots.txt
فایل robots.txt یک فایل متنی است که در مسیر اصلی یا root سایت شما قرار میگیرد که شما میتوانید قوانین خزش صفحات خود را برای موتورهای جستجوی مختلف تعیین کنید و موتورهای جستجو از قوانین مورد ثبت شما در این فایل تبعیت دارند. در این نوشته به شما نحوهی جلوگیری از ایندکس شدن کل سایت شما با کمک فایل robots.txt را بررسی میکنیم.
جلوگیری از خزش سایت با کمک robots.txt
معمولا گاهی برخی از وبسایتها به صورت خصوصی منتشر میشود و به هر دلیلی با مدل بیزنس آن سرویس نیاز است از ایندکس شدن صفحات آن سایت جلوگیری شود؛ برای جلوگیری از ایندکس شدن تمام صفحات یک سایت توسط موتورهای جستجوگر فایل robots.txt را در مسیر root سایت خود باز کنید و یا اگر این فایل را ندارید آنرا بسازید.
بعد از باز شدن این فایل کافی است قطعه کد زیر را در این فایل قرار بدهید و فایل را ذخیره کنید:
User-agent: * Disallow: /
خب حالا به موتورهای جستجوگر نظیر گوگل، بینگ و… این موضوع را اعمال میکنید که قصد ندارید صفحات سایت شما توسط آنها ایندکس شود.
پیشنهاد نویسنده: اضافه کردن نقشه سایت به robots.txt
اگر آموزشهای بیشتری در ارتباط با فایل robots.txt دارید در بخش نظرات به ما اعلام کنید تا در لیست انتشار قرار بگیرد.


















بعد از تغییر فایل robots.txt، چقدر طول میکشه تا گوگل تغییرات رو اعمال کنه؟
اعمال تغییرات در فایل robots.txt توسط گوگل ممکن است از چند ساعت تا چند روز طول بکشد. این زمان به دفعات خزش گوگل از سایت شما بستگی دارد.
برای سایتهای وردپرسی، بهتره این محدودیت از طریق robots.txt اعمال بشه یا افزونههای سئو؟
برای سایتهای وردپرسی، استفاده از افزونههای سئو معمولاً روش سادهتر و کاربرپسندتری برای مدیریت robots.txt و اعمال محدودیتها است
راهی وجود داره که فقط بخش خاصی از سایت برای گوگل مسدود بشه اما بقیه صفحات همچنان ایندکس بمونن؟
بله، با استفاده از دستور `Disallow` و مشخص کردن مسیر بخش مورد نظر، میتوانید این کار را انجام دهید.
آیا همه موتورهای جستجو به قوانین robots.txt پایبند هستن یا بعضیها اون رو نادیده میگیرن؟
اکثر موتورهای جستجوی معتبر به قوانین robots.txt پایبند هستند، اما برخی رباتهای اسپم ممکن است آن را نادیده بگیرند.
اگه از دستور Disallow: / استفاده کنیم، آیا لینکهای قبلی که قبلا ایندکس شدن هم از نتایج گوگل حذف میشن؟
دستور `Disallow: /` از خزش و ایندکس شدن صفحات جدید جلوگیری میکند، اما لینکهای ایندکس شده قبلی ممکن است بلافاصله حذف نشوند و حذف آنها به زمان نیاز دارد.