جستجوی گوگل چطور کار می کند؟

در این مطلب تمامی مراحل و جزئیات نحوه ایندکس مطلب در گوگل را گردآوری کرده‌ام همراه من باشید تا با جزئیات دقیق و کامل نحوه ایندکس مطلب در گوگل آشنا شوید.

چند نکته مهم که خود گوگل می‌گوید:

اولین نکته ای که باید بدانید این است که گوگل وجه مالی برای ایندکس مطالب یک سایت قبول نمی‌کند، اما جایگاه هایی را برای تبلیغات اختصاص می دهد که معمولا آن‌ها را با عبارت "ad" یا "sponsored" مشخص می‌کند.

گوگل تضمینی برای نگه داشتن سایت‌ها در ایندکس خود ندارد و باید همیشه حواستان باشد که دائما طبق آخرین به روزرسانی‌های گوگل پیش بروید و با رعایت قوانین گوگل سایتتان را در ایندکس نگه دارید.

معرفی سه مرحله جستجوی گوگل

موتور جستجوی گوگل بر اساس مراحل زیر عمل می‌کنند و سایت شما را ایندکس می‌کنند. هر یک از مراحل زیر الگوریتم‌های بخصوصی دارد که در ادامه آشنا خواهید شد:

کراولر🕷: کراولر یا خزنده، ربات‌هایی هستند که وظیفه خزش در سایت‌ها و دانلود خودکار تصاویر، ویدیوها و متن های موجود در سایت‌ها را برعهده دارند.

ایندکس: موتورهای جست‌وجو هر محتوایی که در فرایند Crawl یافته‌اند، ذخیره و سازماندهی می‌کنند. به‌این ترتیب، صفحات ایندکس شده برای پاسخ‌گویی به سوالات کاربران، آماده نمایش می‌شود. به عبارتی، محتوایی به مخاطبان عرضه می‌شود که به اندازه کافی مناسب باشد.

ارائه نتایج جستجو: در این مرحله نتایج جست‌وجو به نحوی مرتب می‌شود که بهترین پاسخ برای جست‌وجو کننده نمایش داده شود.

مراحل جستجوی گوگل

کراولر (Crawling) یا خزیدن چیست؟

برای معنی crawler در فارسی می‌توان از خزنده وب استفاده کرد. وظیفه کراولرها جستجو در وب و یافتن صفحات جدید و آپدیت شده است که بعد از یافتن آنها را دانلود و ذخیره می‌کند.

با توجه به اینکه یک رجیستری مرکزی برای همه صفحات وب وجود ندارد بنابراین گوگل باید دائما به دنبال صفحات جدید یا به روز شده باشد و آنها را به لیست صفحات شناخته شده خود اضافه کند این فرآیند "کشف URL" نامیده می شود. برخی از صفحات برای گوگل شناخته شده هستند زیرا گوگل قبلا به آنها سر زده است و آنها را کشف کرده است. اکنون وقتی می‌خواهد به دنبال صفحات جدید برای کشف بگردد به صفحاتی که قبلا ایندکس شده مراجعه می‌کند و لینک‌های آنها را دنبال می‌کند و به صفحات جدید می‌رسد. بنابراین اهمیت لینک دهی را دست کم نگیرید.

هنگامی که Google URL یک صفحه را پیدا کرد ممکن است از آن صفحه یا از اطلاعات موجود در آن صفحه بازدید کند که برای بازدید از صفحات گوگل از میلیارد ها رایانه استفاده می‌کند و برنامه ای که وظیفه خزیدن در سایت‌ها را بر عهده دارد Googlebot نامیده می‌شود و همچنین با نام‌های زیر شناخته می‌شود:

  • خزنده

  • ربات

  • عنکبوت

Googlebot وظیفه تعیین زمانبندی مراجعه به صفحات و چند صفحه از هر سایت را برعده دارد که از الگوریتم مشخصی برای برنامه‌ریزی استفاده می‌کند.

کراولرهای گوگل نیز به گونه‌ای برنامه‌ریزی شده‌اند که سعی می‌کنند سایت را خیلی سریع کراول نکنند تا از بارگذاری بیش از حد مطلب در آن جلوگیری شود(در واقع هر سایت بودجه بندی زمانی خاصی دارد نباید در یک زمان کوتاه چنیدین هزار مطلب در یک سایت بارگزاری شود).در صورتی که بیش از بودجه‌بندی تعیین شده توسط کراولرهای گوگل به سایت مطلب بزنید در این صورت خطاهای HTTP 500 به معنای "کم کردن سرعت" را مشاهده خواهید کرد.

اصطلاح بودجه بندی کراولر به معنای تعداد درخواست در ثانیه Googlebot به سایت شما در هنگام بازدید آن است: مثلاً 5 درخواست در ثانیه. نمی‌توانید تعداد دفعات بازدید گوگل از سایتتان را تغییر دهید، اما اگر می‌خواهید Google محتوای جدید یا به‌روزرسانی شده را در سایت شما ببیند، می‌توانید درخواست بازدید مجدد کنید.

🔔درخواست از گوگل برای بررسی مجدد سایت شما از این ابزار امکان پذیر است.

نکته: Googlebot ممکن است میلیون‌ها صفحه را کشف کند اما به تمامی آنها سرنمیزند یا اصطلاحا نمیخزد زیرا ممکن است برخی از صفحات کشف شده توسط مالک سایت برای خزیدن مجاز نباشد، یا صفحات دیگر ممکن است بدون ورود به سایت قابل دسترسی نباشند.

نکته: در حین خزیدن، Google صفحه را رندر می‌کند و هر جاوا اسکریپتی را که پیدا می‌کند با استفاده از نسخه اخیر Chrome اجرا می‌کند، مشابه نحوه رندر کردن صفحاتی که مرورگر شما بازدید می‌کند. رندر مهم است زیرا وب سایت ها اغلب برای آوردن محتوا به صفحه به جاوا اسکریپت متکی هستند و بدون رندر ممکن است گوگل آن محتوا را نبیند. خزیدن بستگی به این دارد که آیا خزنده‌های گوگل می‌توانند به سایت دسترسی داشته باشند یا خیر.

برخی از مشکلات رایج در دسترسی Googlebot به سایت‌ها عبارتند از:

  • قوانین robots.txt از دسترسی Googlebot به صفحه جلوگیری می‌کند.

  • مشکلات شبکه

  • مشکل با سرور مدیریت سایت

کراولر گوگل CRAWLING

ایندکس INDEXING چیست؟

بعد از اینکه خزنده های گوگل صفحات موجود در وب را یافتند به سراغ مرحله بعدی می‌روند که اصطلاحا مرحله ایندکس نامیده می‌شود. در مرحله ایندکس که اصطلاحا فهرست سازی نامیده می‌شود پردازش و تجزیه و تحلیل محتوای متنی و برچسب‌ها و ویژگی‌های محتوای کلیدی، مانند عنوان ها و ویژگی‌های alt، تصاویر، ویدئوها و غیره انجام می‌شود.

در این تجزیه و تحلیل ابتدا گوگل سعی می‌کند نتایج مشابهی که از یک موضوع به دست آورده است را در کنار هم قرار دهد و بررسی کند. در انجام بررسی صفحه‌ای انتخاب می‌شود که کامل تر بیان کننده موضوع باشد و اصطلاحا نماینده صفحات مقایسه شده باشد. صفحات دیگر هم کنار گزاشته نمی‌شوند و با توجه به مطالب درج شده در صفحه ممکن است در جستجوهای دیگر در اولویت قرار داده شوند.

از صفحات منتخب، گوگل سیگنال هایی را گردآوری می‌کند و در یک پایگاه داده بزرگ که بر روی هزاران رایانه میزبانی می‌شود، ذخیره می‌شود. سپس گوگل این سیگنال ها را در مرحله بعدی بررسی و تحلیل می‌کند.

سیگنال هایی که گوگل از یک مطلب ذخیره می‌کند مربوط به زبان محتوا و کشور بومی محتوا است که بعدا در اولویت قرار خواهد گرفت.

نکته مهم: صفحه ای که ایندکس شده و گوگل جزئیات آنرا تحلیل کرده است ترجیحا در صفحه اول جستجوی گوگل قرار نمیگرد و اولیت قرار گیری صفحات در جستجو مربوط به بخش بعدی می‌باشد.

همانطور که گفته شد گوگل تضمین نمی‌کند که تمامی صفحات ایندکس شده را نمایه کند دلیل اینکه برخی از مطالب حتی بعد از ایندکس نمایه نمی‌شوند موارد زیر میباشد:

  • کیفیت محتوای قرار گرفته شده در صفحه بسیار ضعیف باشد.

  • برخی از قوانین ربات های گوگل ایراداتی در محتوا می‌بینند که محتوا را قابل نمایه سازی نمی‌دانند.

  • طراحی وب سایت به نحوی است که نمایش مطلب در جستجو را دشوار کرده است.

ارائه نتایج جستجو در گوگل چگونه است؟

و اما مرحله نهایی که وقتی کاربر عبارتی را جستجو می‌کند چه نتایجی برای وی نمایش داده شوند و گوگل بر چه اساسی این مطالب را رتبه بندی می‌کند و به کاربر نمایش میدهد.

نتایجی که برای کاربران نمایش داده می‌شوند از دیدگاه گوگل بالاترین کیفیت و مرتبط ترین با درخواست کاربر هستند. مرتبط‌ترین مطلب توسط صدها عامل تشخیص داده می‌شود من جمله زبان کاربر، کشور محل زندگی کاربر، استفاده از گوشی تبلت یا رایانه رومیزی و ….

برای مثال، جستجوی «تعمیرگاه‌های دوچرخه» نتایج متفاوتی را برای کاربر در پاریس نسبت به کاربر هنگ‌کنگ نشان می‌دهد.

بر اساس درخواست کاربر، ویژگی های جستجو که در صفحه نتایج جستجو ظاهر می شود نیز تغییر می کند. برای مثال، جستجوی «تعمیرگاه‌های دوچرخه» احتمالاً نتایج محلی را نشان می‌دهد و هیچ نتیجه تصویری را نشان نمی‌دهد، اما جستجوی «دوچرخه مدرن» به احتمال زیاد نتایج تصویر را نشان می‌دهد، اما نتایج محلی را نشان نمی‌دهد.

اگر در کنسول جستجوی گوگل دیدید که یک مطلب ایندکس شده است اما در نتایج گوگل نمایش داده نمیشود ممکن است به دلیل یکی از موارد زیر باشد.

  • محتوای صفحه نسبت به سوالات کاربران بی ربط است.

  • کیفیت مطلب پایین است.

  • قوانین متا ربات‌ها از سرویس دهی جلوگیری می‌کنند.

ایندکس مطلب در گوگل

امیدوارم این مطلب براتون کاربردی بوده باشه.🎀


کامنت ها