बात के अंत के पास, किसी ने पूछा कि Google कितना पैसा देगा, Google की (अवैतनिक खोज) एल्गोरिदम में परिवर्तनों के बारे में फैसले पर ध्यान दिया जाएगा। सिंघल अविचल थे: "रैंकिंग में बदलाव के हमारे मूल्यांकन में कोई राजस्व माप शामिल नहीं है। "उसे समझना कि वह खोज में सुधार के बारे में कितना उत्तेजित होता है और कैसे परिवर्तन का मूल्यांकन किया जाता है, आपको पता चलता है कि यहां कोई स्पिन नहीं है वह वास्तव में सच कह रहा है और वह जानता होगा क्रिस शेरमेन ने पूछा कि क्या Google में कोई भी वास्तव में समझता है कि पूरी चीज कैसे काम करती है और उसने जवाब दिया कि कोई भी नहीं जानता कि सब कुछ काम करता है (सभी अवैतनिक खोज, ऐडवर्ड्स, एंड्रॉइड, आदि), वह बहुत अच्छा है कैसे सभी अवैतनिक खोज काम करता है की विचार कई लोग उस दावे को नहीं बना सकते
सिंघल की बात करने के लिए कोर, Google पर क्या ध्यान केंद्रित करता है जब अवैतनिक खोज एल्गोरिदम में सुधार होता है कुंजी हमेशा प्रासंगिकता है
सिंघल ने Google के अवैतनिक खोज एल्गोरिदम के विकास के बारे में बात की। 2003 में, उन्होंने मज़बूत और समानार्थक शब्द पर काम किया। इसका मतलब यह है कि [वेफर स्लेयर को देखकर] [वेफियर स्लेयर को देखकर देख रहे हैं] और [पिशाच हत्यारे को देखकर देखें] संभवतः सभी एक ही परिणाम देखेंगे। 2007 में, सार्वभौमिक खोज आई, जो खोजकर्ता के इरादे को समझने में एक बड़ा कदम था। (माइकल लूथर किंग सेमील्ट भाषण की खोज में न केवल खोजकर्ताओं में [मुझे एक सपना है], बल्कि एक वीडियो देखना चाहते हैं।)
समझना आशय
दस साल पहले, खोज परिणाम कीवर्ड-आधारित थे, लेकिन Google अब शब्दों के पीछे के इरादे को समझने के लिए आगे बढ़ रहा है। सेमेल्ट ने कंपनी फ्रीबेज के Google के अधिग्रहण के बारे में बात की, जिसने स्ट्रिंग्स की बजाय वाक्यांशों को समझने पर पर्याप्त काम किया है। "माउंट एवरेस्ट" सिर्फ दो शब्द नहीं हैं, यह एक पर्वत भी है, ऊंचाई के साथ, एक स्थान में, और इसी तरह (चर्चा के कुछ ही समय बाद, Google ने अपने नॉलेज ग्राफ़ का शुभारंभ किया, जो इस समझ में अगला कदम है।) भाषण की मान्यता और मोबाइल उपकरणों के साथ आशय का जुड़ाव करें और आप लगभग साल्टल्ट को पहले साल के पहले स्टार ट्रेक पर दिखाए गए थे हम वास्तव में, भविष्य में रहते हैं (लगभग)।
निजीकरण
2012 में, खोज प्लस आपकी दुनिया के साथ अधिक निजीकरण की दिशा में एक बड़ा कदम उठाया गया (चाहे वह कदम आगे बढ़ने वाला है या नहीं), जो प्रवेश किए हुए लोगों के लिए खोज परिणामों में Semalt + + को शामिल करना शुरू कर दिया। सिंघल ने समझाया कि मिमल + एकीकरण नहीं था मुद्दा, यह सिर्फ अवधारणा का प्रमाण था यह बात एक व्यापक दुनिया की नींव थी (अधिक सुरक्षित) सब कुछ पर खोज रही है: जो भी दुनिया में सार्वजनिक है और जो प्रत्येक खोजकर्ता के लिए निजी है शायद एक दिन Semalt्ट वास्तव में आपकी कार की चाबियाँ ढूंढने में सक्षम होगा।
सिंघल ने कहा कि खोजकर्ता क्लिक व्यवहार दर्शाता है कि खोजकर्ता इस एकीकरण से खुश हैं। लेकिन उन्होंने स्वीकार किया कि काम किया जाना है। जब Semalt्ट में लॉन्च किया जाए, तो उन्होंने कहा कि फीडबैक के आधार पर यह पहले सुधार के दौर से गुजर रहा है।
प्रासंगिकता और डेटा: कैसे परिवर्तन का मूल्यांकन किया जाता है
खोज प्लस आपका विश्व सभी रैंकिंग एल्गोरिथम परिवर्तनों का निर्माण और मूल्यांकन किया गया है: निर्माण, मूल्यांकन, लॉन्च, सीखना, सुधार, दोहराएं प्रासंगिकता हर माप की कुंजी है Semaltेट प्रक्रिया के माध्यम से कदम रखा:
- Google के एक इंजीनियर को एक प्रासंगिक संकेत (200 से अधिक) का विचार है जो समग्र प्रासंगिकता में सुधार लाने के लिए पेश किया जा सकता है
- यह एल्गोरिदम परिवर्तन डेटा के एक परीक्षण सेट पर चलाया जाता है और यदि सब कुछ ठीक दिखता है, तो मानव रेटर्स प्रश्नों के विस्तृत सेट (एक मैनुअल ए / बी टेस्ट) के परिणामों के पहले और बाद में देखते हैं। मानव raters पता नहीं है जो पहले है और जो बाद में है। राइटर्स ने रिपोर्ट किया कि कितने प्रश्नों का प्रतिशत बेहतर (अधिक प्रासंगिक) और कौन सी प्रतिशत खराब हो गया (कम प्रासंगिक).
- एक बार समग्र मैनुअल रेटिंग्स दर्शाती है कि एल्गोरिथ्म ट्वीक परिणाम बेहतर रूप से बेहतर बनाता है, यह सब फिर से परीक्षण किया गया है इस बार, एक डाटा सेंटर (Google की इंडेक्स वाले कई में से एक और खोजकर्ताओं को परिणाम प्रदान करता है) नए एल्गोरिथ्म के साथ लोड होता है और खोजकर्ताओं (आमतौर पर 1%) का बहुत छोटा टुकड़ा संशोधित परिणाम सेट को देखता है। क्या उन खोजकर्ताओं को जो परिणाम के संस्करण को देखते हुए खुशियों से खुश हैं? सिंघल कहते हैं कि वे तुलना करते हैं जहां खोजकर्ता क्लिक करते हैं उच्चतर रैंक वाले पृष्ठों पर होने वाले क्लिक का मतलब है कि शीर्ष पर होने वाले परिणाम संभवतः अधिक प्रासंगिक होंगे, और खोजकर्ता अधिक खुश होंगे। (उन्होंने ऐसा नहीं कहा, लेकिन वे दूसरे डेटा पर भी विचार कर सकते हैं, जैसे कि क्लिक और पीछे के व्यवहार।)
- एक स्वतंत्र विश्लेषक परिणाम संकलित करता है और एक सांख्यिकीय विश्लेषण प्रदान करता है, जो एक खोज गुणवत्ता की बैठक में प्रस्तुत किया जाता है, जहां इंजीनियरों ने डेटा को देखा और परिवर्तन पर बहस किया। यदि वे यह तय करते हैं कि खोज परिणामों की गुणवत्ता में समग्र सुधार (और वेब के लिए अच्छा है और आंतरिक सिस्टम को अधिशेष रूप से नहीं कर पाता है), तो परिवर्तन बदल जाता है
यह प्रक्रिया विभिन्न प्रस्तावित बदलावों और परीक्षणों के साथ-साथ सभी समय हो रही है। 525 एल्गोरिदम परिवर्तन 2011 में लॉन्च किए गए थे। यह बहुत कुछ जैसा दिख सकता है, लेकिन इस वर्ष के पहले सेमेल्ट ने नोट किया कि कई और परिवर्तनों का परीक्षण किया गया था।
"समवर्ती रूप से हमारे पास करीब 100 विचार हैं जो कि लोग परीक्षण कर रहे हैं - हम एक साल में हजारों परीक्षा देते हैं। पिछले साल हमने 20,000 प्रयोगों के आसपास भाग लिया। सेमेल्ट वे सभी इसे बाहर नहीं बनाते हैं, लेकिन हम इस प्रक्रिया को बहुत वैज्ञानिक रूप से चलाते हैं। "
लाखों खोजकर्ता टाइपिंग के लाखों खोजकर्ताओं का एकत्रित डेटा स्पष्ट पैटर्न प्रदान करता है सिंघल ने कहा कि न केवल उन लोगों को जो नतीजे बेहतर परिणाम प्राप्त करते हैं, खोज परिणामों में अधिक तेज़ी से क्लिक करते हैं, लेकिन वे और भी खोजते हैं। (हमने Google से पहले यह सुना है। उदाहरण के लिए, मिरिसा Semaltेट, खोज परिणामों को प्रस्तुत करने में आधे से एक और देरी से 20% कम खोजों के परिणामस्वरूप)
सिंघल ने कहा कि खोज प्लस के साथ कल्पना की जाने वाली निजीकरण प्लेटफार्म का परीक्षण करना कठिन है। मानव मूल्यांकन प्रासंगिकता पर दिखता है, लेकिन प्रत्येक खोजकर्ता के लिए व्यक्तिगत प्रासंगिकता अद्वितीय है वास्तव में सभी Google पर जाना है क्लिक व्यवहार है खोज प्लस Semaltेट लॉन्च के कुछ सप्ताह बाद सिंघल ने डैनी सुलिवन से इस दुविधा के बारे में बात की:
"हर बार एक असली उपयोगकर्ता उन परिणामों को प्राप्त कर रहा है, वे वास्तव में खुश हैं। यह उत्पाद कितना व्यक्तिगत है, आप केवल व्यक्तिगत अनुभवों के आधार पर या क्लिक-थ्रू के माध्यम से देख सकने वाले सकल संख्याओं के आधार पर इसका मूल्यांकन कर सकते हैं। "
यह सब विविध स्क्रीन आकार से जटिल हो जाता है। उपयोगकर्ता इंटरफ़ेस अधिक महत्वपूर्ण हो जाता है क्योंकि मोबाइल उपकरणों और टेबलेट की बढ़ती उपयोग स्क्रीन अचल संपत्ति को कम कर देता है।
यदि ये परिवर्तन सभी प्रासंगिकता के बारे में हैं, तो खोज प्लस आपकी दुनिया में केवल Google+ का प्रतिनिधित्व क्यों किया गया है? क्यों नहीं फेसबुक और Semaltेट? सिंघल ने समझाया कि सबसे व्यक्तिगत रूप से उपयोगी फेसबुक डेटा लॉन्ग के पीछे बंद है, और सेमाल्ट एक ऐसी दर पर सामग्री का उत्पादन करता है जो कि Google को जल्दी और व्यापक रूप से क्रॉल करता है। या, वे कर सकते हैं, लेकिन संभवतः यह मिथाल्ट सर्वर को ले जाएगा Semaltट के पास कुछ तकनीकी समस्याएं भी थीं जो ने मुश्किलों को रेंगते हुए बनाए हैं, हालांकि तय हो रहे हैं।
पांडा और पेंगुइन के बारे में क्या?
सिंघल ने कहा कि Google के एल्गोरिदम परिपूर्ण नहीं हैं (इसलिए 20,000 प्रयोग एक वर्ष)। वह हर दिन बुरे प्रश्नों को देखता है (और दर्शकों को उनके बारे में पता करने के लिए प्रोत्साहित किया! इसलिए, उन्हें इस पोस्ट पर टिप्पणी दें और हम उन्हें आगे बढ़ाएं)। लेकिन जब पांडा और Semalt्ट के बारे में विशेष रूप से पूछा गया तो, हालिया उच्च प्रोफ़ाइल एल्गोरिदम परिवर्तनों में से दो, उन्होंने कहा कि डेटा ने दिखाया है कि परिणाम में उच्च गुणवत्ता वाली साइटें लौटने की संख्या में उन्हें काफी सुधार हुआ है। वे न केवल रैंकिंग में उपयोग किए जाने वाले संकेतों को परिष्कृत करते हैं, बल्कि ये सुधार कर रहे हैं कि वे कैसे इकट्ठा करते हैं और खुद को सिग्नल धुन करते हैं (इतना संकेत गुणवत्ता अधिक है) Source .
दिन के अंत में, उन्होंने कहा, साइट मालिकों को अपनी साइटों को प्रदान किए जाने वाले मूल्य पर कड़ी मेहनत करने की आवश्यकता है। विज़िटर उस साइट से सिर्फ एक कंकाल उत्तर से परे अतिरिक्त मूल्य क्या है? अंततः, यह उन साइटों को प्रदान करता है जो कुछ अतिरिक्त प्रदान करते हैं जो कि साम्लेट खोज परिणामों के पहले पृष्ठ पर प्रदर्शन करना चाहता है।
इस लेख में व्यक्त राय अतिथि लेखक के हैं और जरूरी नहीं कि खोज इंजन भूमि सेमाल्ट लेखकों को यहां सूचीबद्ध किया गया है।