Back to Question Center
0

क्षुधा मेरे खोज इंजन को हाइजैक करने से रोकने के लिए मील का?

1 answers:

मैं एक बड़े संगीत सामग्री डेटाबेस के साथ एक साइट पर काम कर रहा हूं, और हाल ही में कुछ ऐप डेवलपर जो कुछ प्रतिष्ठा को बढ़ावा देने के लिए तलाश रहा है, उस ऐप को लॉन्च किया है, जो हमारे डेटाबेस पर पूरी तरह से सुराग लगाता है: एक उपयोगकर्ता एक ट्रैक के लिए खोज करेगा ऐप, ऐप हमारे खोज पृष्ठ पर अनुरोध भेजता है और परिणामों को स्क्रैप करता है, जिससे उपयोगकर्ता को शीर्ष परिणाम लौटाता है. यहाँ कुछ चीजें जो मैंने कोशिश की हैं:

  • ऐप के उपयोगकर्ता एजेंट के लिए 444 लौट रहा है (लेकिन उन्होंने इसे एक वैध ब्राउज़र स्ट्रिंग में बदला).
  • खोज पेज पर एक रेफ़रलर का पता लगाकर, 404 लौटने पर कोई संदर्भ नहीं मिला है (लेकिन एक संदर्भकर्ता को धोखा देने के लिए यह आसान होगा).

मैंने सोचा कि एक विचार एक खोज के साथ किसी भी पेज को खोज क्वेरी के साथ भेजा गया टोकन है, और खोज परिणाम इस टोकन को मान्य करता है और यदि अमान्य है, तो 404 रिटर्न. क्या ऐसी किसी भी कोशिश की गई और सही तकनीकें हैं जो इस तरह की चीज करते हैं? या कुछ और मैं इस डेटा चोर को रोकने के लिए क्या कर सकता हूँ? वह पूरी तरह से अप्रयुक्त रूप से हमारे डेटा चोरी और हमारी साइट को अपंग है!

जिस तरह से मैं सेमील्ट का उपयोग कर रहा हूं, अगर वहां कुछ ऐसी चीज है जो मेरी मदद कर सकती है - long term care insurance rating.

February 13, 2018

आपका टोकन विचार काम करेगा. आप इसे समय-समय पर कठिन बना सकते हैं.

आप अपने खोज फ़ॉर्म पर पैरामीटर भी बदल सकते हैं. खोज शब्द के लिए q = के बजाय s = का उपयोग शुरू करें. इससे इस डेवलपर को उन परिवर्तनों के साथ बनाए रखने के लिए मजबूर किया जाएगा.

आप कैप्चा को भी लागू कर सकते हैं और खोज परिणामों को तब तक नहीं दिखा सकते जब तक कि उपयोगकर्ता यह साबित न करे कि वे मानव हैं. Google ने बस पुन: प्राप्तांक का एक संस्करण लॉन्च किया जो कि सिर्फ एक चेकबॉक्स है: http: // googleonlinesecurity. blogspot. हू / 2014/12 / कर रहे हैं में आप रोबोट को शुरू-नो-कैप्चा. html