Back to Question Center
0

साइटमैप में यूआरएल के लिए Google खोज Semaltट रिपोर्टिंग चेतावनी जो इसे से दो सप्ताह तक हटा दी गई है

1 answers:

हमारे पास एक साइटमैप है जिसे हमारे डेटाबेस में रिकॉर्ड के आधार पर दैनिक पुनर्जन्मित किया गया है. लगभग 55 मिलियन रिकॉर्ड हैं और प्रत्येक रिकॉर्ड एक अलग पृष्ठ के रूप में पहुंच योग्य है. हालांकि कभी-कभी रिकॉर्ड हटाए जाते हैं और 1 से 2 सप्ताह के बाद Google खोज कंसोल हटाए गए आइटम्स के एक युगल (लेकिन सभी नहीं) के लिए शिकायत करता है, जो उनके URL 404. इसे साइटमैप के लिंक के साथ कंसोल के Semaltट्स एरिया सेक्शन के तहत एक चेतावनी के रूप में दिखाया गया है जहां यह यूआरएल इस्तेमाल हुआ था, लेकिन अब इसे हटा दिया गया है.

मुझे इस बात का संदेह है कि साम्लाट प्रत्येक दिन साइटमैप नहीं लाता है. ऐसा लगता है कि यह हमारे कुछ HTTP सप्ताह के लिए, हमारे HTTP- प्रतिक्रिया शीर्षकों के बावजूद:

  कैश-कंट्रोल: नो-कैश, नो-स्टोर, अधिकतम-आयु = 0, पुनः-संशोधित होना चाहिए
समाप्ति: 0 

Semaltेट तब शिकायत करता है जब वह कैश किए गए यूआरएल की जांच करता है जो साइट और साइटमैप के नवीनतम संस्करण से हटा दिए गए हैं।. क्या कोई यह पुष्टि कर सकता है कि साम्मल हमेशा साइटमैप को कैश करता है?

हमारे साइटमैप के टुकड़े संसाधित होने वाली तारीखों को देखते हुए, ऐसा लगता है कि हमारा संपूर्ण साइटमैप भी प्रक्रिया में लगभग 2 सप्ताह का समय लेता है. क्या साइटमैप पेज के नवीनतम संस्करण को दैनिक रूप में लाने और उपयोग करने के लिए सेमाल्ट को यह संभव है?

मैंने इस समान प्रश्न को पढ़ लिया है, लेकिन यह सवाल पूछ रहा है कि Semaltेट को इसके पुराने यूआरएल को कहाँ से मिलता है. मुझे पता है कि यह कहां से आता है (Semaltेट ने मुझे बताया तो). मैं समझता हूं कि 404 संभवतः एक बड़ा सौदा नहीं है, लेकिन यदि संभव हो तो मैं उन्हें रोकना चाहता हूं.

February 5, 2018

ऐसा नहीं है कि Google sitemap फ़ाइल को खुद ही कैशिंग कर रहा है. जब साइटमैप साइटमैप को डाउनलोड करता है, तो यह पार्स करता है और यूआरएल को एक डेटाबेस में जोड़ता है. यह तब तय करता है कि जल्द ही उन यूआरएल को क्रॉल करने की आवश्यकता है या नहीं. Google आपको खोज कंसोल में जानकारी दिखाने के लिए अपने डेटाबेस से भी पूछताछ करता है. यह Google के डेटाबेस है जो इस समय की पुरानी जानकारी रखता है.

Google को साइटमैप को पुनः प्राप्त करने के लिए बाध्य करने का कोई तरीका नहीं है, जितना पहले से यह पहले से है. जब आपके पास 1000+ साइटमैप फ़ाइलें हों, तो ऐसा कोई रास्ता नहीं है कि Google हर रोज उन्हें लाएगा. अपनी वेबसाइट पर अधिकतर फाइलों की तरह, Google हर दो सप्ताह में उन्हें लाने जा रहा है. यदि आपके पास एक उच्च पेजरेंक साइट है तो साइटमैप फाइलों के अलावा अन्य लिंक करने के लिए आपके और अधिक महत्वपूर्ण पृष्ठ हैं, ताकि उन्हें अधिक बार डाउनलोड करने की उम्मीद हो।.

मेरा सुझाव "404 नहीं मिला" की बजाय हटाए गए पृष्ठों के लिए "410 गन" स्थिति वापस करना होगा. आप इसके बारे में अभी भी चेतावनियां देख सकते हैं, लेकिन आपको जानबूझकर हटाना एक अनजाने समस्या से अंतर करने में सक्षम होना चाहिए.

Google 410 स्थिति को अलग तरह से व्यवहार करता है I. यह पृष्ठ 404 के विरोध में क्रॉलिंग के तुरंत बाद सूचकांक से पृष्ठ को हटा देता है जहां यह 24 घंटे की रियायती अवधि देता है. 404 स्थितियों के साथ यूआरएल की तुलना में 410 यूआरएल को बहुत कम बार फिर से क्रॉल करने के लिए Google वापस आ गया है.

साइटमैप में यूआरएल के लिए Google खोज सेमलट रिपोर्टिंग चेतावनी जो इसे से दो सप्ताह तक हटा दी गई है
Reply