एआई सर्च दिग्गजों का सामना: क्लाउड, चैटजीपीटी, पेरप्लेक्सिटी और जेमिनी - परिणाम चौंकाने वाले हैं!

उत्तर की खोज

0

एआई चैटबॉट्स और उनकी विशेषताओं का वर्षों तक परीक्षण और तुलना करने के बाद, मैंने एक प्रकार की छठी इंद्री विकसित कर ली है, जिससे मैं यह बता सकता हूं कि कब ये डिजिटल साथी जानते हैं कि वे किस बारे में बात कर रहे हैं और कब वे केवल धोखा दे रहे हैं। यह आलेख ChatGPT, Gemini, Claude और Perplexity की खोज क्षमताओं की तुलना करता है।

अधिकांश लोग ऑनलाइन उत्तर खोज सकते हैं, जो निश्चित रूप से मददगार है, लेकिन खोज को एआई के साथ संयोजित करने से कुछ आश्चर्यजनक रूप से व्यावहारिक उत्तर (और कुछ कम व्यावहारिक विषयांतर) प्राप्त हो सकते हैं।

बासेट हाउंड पिल्ले

कल्पना कीजिए कि आपका कोई जानकार मित्र अक्टूबर 2024 में कोमा में चला गया हो और आज ही होश में आया हो। कोमा में जाने से पहले वह शायद हर चीज में निपुण था, लेकिन उसके बाद से वह किसी भी चीज के बारे में अनभिज्ञ है। मूलतः, अनुसंधान के बिना AI ऐसी ही दिखती है।

मैं आमतौर पर एक एआई चैटबॉट पर ध्यान केंद्रित करता हूं या एक समय में दो की तुलना करता हूं, लेकिन यह शोध इस प्रयास को बढ़ाने के लिए पर्याप्त महत्वपूर्ण लगता है। मैंने चार अग्रणी एआई चैटबॉट्स और उनकी शोध क्षमताओं को एक दूसरे के विरुद्ध खड़ा करने का निर्णय लिया: ओपनएआई से चैटजीपीटी, गूगल से जेमिनी, एंथ्रोपिक से क्लाउड और पेरप्लेक्सिटी एआई।

सबसे अधिक खुलासा करने वाले परीक्षण वे हैं जो वास्तविक दुनिया के उपयोग परिदृश्यों का अनुकरण करते हैं। इसलिए, मैंने कुछ विषय चुने, नीचे दिए गए परीक्षणों के लिए कुछ विवरण यादृच्छिक किए, और फिर उनकी शोध क्षमताओं के आधार पर उन्हें रैंक करने का निर्णय लिया।

पंचांग

एआई खोज परीक्षण

मैंने समाचार और समसामयिक घटनाओं पर आधारित प्रश्नोत्तरी से शुरुआत की। हाल ही में दो अंतरिक्ष यात्रियों की वापसी के बारे में सोचते हुए, मैंने चार एआई चैटबॉट्स को निम्नलिखित की खोज करने के लिए कहा: “नासा के आगामी मिशन के बारे में नवीनतम प्रेस विज्ञप्ति के मुख्य बिंदुओं का सारांश।”

मैंने इसे इसलिए चुना क्योंकि अंतरिक्ष समाचार नियमित रूप से अपडेट होने के कारण विशेष स्थान रखता है तथा इतना विशिष्ट होता है कि अस्पष्ट प्रतिक्रियाएं भी तुरंत स्पष्ट हो जाती हैं। सभी चैटबॉट्स ने अपने परीक्षण उसी शैली में शुरू किए, जिसे उन्होंने अधिकांशतः पूरे परीक्षण में बनाए रखा।

चैटजीपीटी ने अपने उत्तर में अविश्वसनीय रूप से संक्षिप्तता दिखाई, केवल तीन वाक्यों में, प्रत्येक में आगामी कार्यों का उल्लेख किया गया, लेकिन अधिक विवरण नहीं दिया गया। जैमिनी ने विभिन्न कार्यों की एक बुलेटेड सूची तैयार की, जिसमें हाल ही में पूर्ण किए गए कुछ कार्यों और भविष्य की योजनाओं का विवरण भी शामिल किया गया। क्लाउड ने वर्तमान और आगामी कार्यों के बारे में एक लेख लिखा, जिसमें उन्होंने बताया कि उन्होंने अपने शोध को ज्यादा दोहराया नहीं, बल्कि काफी कुछ पुनर्लेखन किया।

इस तरह के प्रश्न के लिए, जहां मुझे बस कुछ महत्वपूर्ण तथ्य चाहिए होते हैं और जो भी चीज मेरी नजर में आती है, उस पर आगे की कार्रवाई करने की योजना होती है, वहां पर्प्लेक्सिटी विधि मेरी पसंदीदा थी। इसमें चैटजीपीटी की तुलना में अधिक विवरण है, लेकिन इसे एक अच्छी क्रमांकित सूची में व्यवस्थित किया गया है, जिनमें से प्रत्येक का अपना उद्धरण लिंक है।

मैं वास्तव में किसी को दोष नहीं दे सकता, लेकिन शैली प्रश्न के अनुरूप है।

जनसंख्या और संख्या

एआई खोज परीक्षण

बुनियादी तथ्यों और अधिक सटीक तुलना के बारे में प्रश्न पूछते समय यह सूची दृष्टिकोण हमेशा वह नहीं होता जो आप चाहते हैं। मैंने दो संबंधित तथ्य पूछे जिन्हें एआई चैटबॉट तुरंत देख सकते थे, लेकिन फिर उन्हें तुलना करने की आवश्यकता होगी, इस संकेत का उपयोग करते हुए: "ऑकलैंड, न्यूजीलैंड की वर्तमान जनसंख्या कितनी है, *और 1950 के बाद से इसमें कितनी वृद्धि हुई है?"*

दिलचस्प बात यह है कि पेरप्लेक्सिटी और चैटजीपीटी के बीच विसंगति थी, जहां 1,711,130 की वर्तमान जनसंख्या बताई गई थी, जबकि क्लाउड और जेमिनी के बीच विसंगति थी, जहां ऑकलैंड में 130 कम लोगों की जानकारी दी गई थी। हालाँकि, 1950 में वे सभी जनसंख्या पर सहमत हो गये।

हालांकि, जिस तरह से प्रत्येक ने जानकारी प्रस्तुत की, मुझे क्लाउड का वर्णनात्मक उत्तर पसंद आया, जिसमें जनसंख्या परिवर्तन के बारे में कई विवरण शामिल थे, जो चैटजीपीटी में नहीं थे और जिन्हें जेमिनी और पेरप्लेक्सिटी ने सूचियों में शामिल किया था।

क्या होता है?

एआई खोज परीक्षण

अपने तीसरे परीक्षण के लिए, मैं कुछ ऐसा प्रस्तुत करना चाहता था जो इन प्रणालियों की किसी विशिष्ट स्थान और समय से संबंधित जानकारी को संभालने की क्षमता को चुनौती दे सके - एक प्रकार की क्वेरी जिसे आप सप्ताहांत की यात्रा की योजना बनाते समय या आगंतुकों की मेजबानी करते समय पूछ सकते हैं।

यहीं पर एआई सहायकों के लिए कठिनाई है। ऐतिहासिक तथ्य या सामान्य जानकारी जानना एक बात है, लेकिन किसी विशिष्ट स्थान पर किसी विशिष्ट समय में क्या हो रहा है, यह जानना एकदम अलग बात है।

यह सैद्धांतिक ज्ञान और स्थानीय ज्ञान के बीच का अंतर है, और ऐतिहासिक रूप से, एआई प्रणालियाँ स्थानीय ज्ञान की तुलना में सैद्धांतिक ज्ञान में कहीं बेहतर रही हैं।

बिना किसी विशेष कारण के, मैंने एक ऐसा शहर चुना जिसे मैं हमेशा से पसंद करता था और पूछा: अगले सप्ताहांत वैंकूवर, ब्रिटिश कोलंबिया में कौन से सांस्कृतिक कार्यक्रम होने वाले हैं?

इसमें कुछ वास्तविक भिन्नता थी। पेरप्लेक्सिटी और क्लाउड दोनों ने क्रमांकित सूची और अधिक संवादात्मक चर्चा प्रस्तुत करके अपनी संक्षिप्तता और शैली को बनाए रखा। हालाँकि, क्लाउड गहराई के बजाय अधिक व्यापक हो गया, और अधिक पेरप्लेक्सिटी जैसा लग रहा था।

जैमिनी अपने प्रतिद्वंद्वियों से पूरी तरह से अलग हो गए और मूलतः जवाब देने से इनकार कर दिया। घटनाओं और गतिविधियों की एक जैसी सूची साझा करने के बजाय, जेमिनी ने जाने योग्य स्थानों को खोजने की रणनीतियां पेश कीं। आधिकारिक पर्यटन वेबसाइटों और इवेंटब्राइट पृष्ठों की जांच करना बुरा विचार नहीं है, लेकिन वे सुझावों की सीधी सूची से बहुत दूर हैं। इस तरह से यह सामान्य गूगल सर्च करने जैसा था।

इस बीच, चैटजीपीटी ने वही दिया जिसकी मुझे जेमिनी से उम्मीद थी। हालाँकि इवेंट का विवरण छोटा ही रहा, लेकिन एआई में विशिष्ट गतिविधियों की एक मज़बूत सूची थी जिसमें तारीखें और स्थान, प्लस नॉलेज के लिंक, और यहाँ तक कि लिंक में आपको क्या मिलेगा, उसके थंबनेल भी थे।

मौसम की जांच करें

एआई खोज परीक्षण

अपने चौथे परीक्षण के लिए, मैंने संभवतः किसी भी AI का सबसे अधिक पूछा जाने वाला प्रश्न चुना, लेकिन इसके उपयोगी होने के लिए वास्तविक समय के डेटा की आवश्यकता होती है: मौसम। मौसम पूर्वानुमान वास्तविक समय डेटा पुनर्प्राप्ति के परीक्षण के लिए आदर्श होते हैं क्योंकि वे लगातार अद्यतन होते हैं, व्यापक रूप से उपलब्ध होते हैं, तथा उनका सत्यापन आसान होता है। इसकी एक प्राकृतिक समाप्ति तिथि भी होती है; कल के पूर्वानुमान पहले ही पुराने हो चुके हैं, जिससे यह स्पष्ट हो जाता है कि जानकारी कब पुरानी हो जाती है।

मैंने एआई चैटबॉट से पूछा, "अगले तीन दिनों के लिए टोक्यो में मौसम का पूर्वानुमान क्या है?" जवाब वैंकूवर के प्रश्न के लगभग विपरीत थे।

क्लाउड ने अगले तीन दिनों में विभिन्न समय पर मौसम का उपयोगी सारांश उपलब्ध कराया, लेकिन बस इतना ही। चैटजीपीटी ने प्रत्येक दिन के मौसम सारांश के बगल में एक छोटा सा सूर्य या बादल का चिह्न दिखाया, लेकिन मुझे वास्तव में पेरप्लेक्सिटी का तापमान का रेखा ग्राफ बहुत पसंद आया, जो आकाश के तापमान से मेल खाता था।

बिना किसी ऐड-ऑन के, गूगल जेमिनी ने अपने रंगीन इन्फोग्राफिक से मेरा दिल जीत लिया। जब मैं वर्तमान और आगामी मौसम के बारे में जानने के बारे में सोचता हूं, तो मुझे लगता है कि यही वह सब है जिसकी मुझे आवश्यकता है या जो मैं चाहता हूं।

यदि मैं अधिक जानकारी पूछना चाहता तो पूछता, लेकिन मौसम के बारे में पूछने का मतलब है कि मैं न्यूनतम जानकारी चाहता हूं कि मुझे अपने लिए उपयुक्त पोशाक का चयन कैसे करना है।

फिल्म समीक्षक

एआई खोज परीक्षण

अपने नवीनतम परीक्षण में, मैं यह देखना चाहता था कि एआई-संचालित खोज इंजन किसी विषय पर विभिन्न दृष्टिकोणों को खोजने और उन्हें एक सुसंगत अवलोकन में प्रस्तुत करने में कैसा प्रदर्शन करेंगे। इस कार्य के लिए लचीले शोध और विभिन्न दृष्टिकोणों को समझने की क्षमता की आवश्यकता होती है। मैंने यह देखने का निर्णय लिया कि एक अनुरोध के साथ यह कैसे होगा: नवीनतम फिल्म की व्यावसायिक आलोचकों की समीक्षाओं का सारांश दीजिए। Paddington".

इस अनुप्रयोग के लिए यथार्थवादी स्मरण शक्ति तथा महत्वपूर्ण बारीकियों को खोए बिना विभिन्न स्रोतों में पैटर्न और विषयों को पहचानने की क्षमता की आवश्यकता थी। यह विचारों के एक सरल संग्रह और आलोचनात्मक आम सहमति को मूर्त रूप देने वाले विचारशील संश्लेषण के बीच का अंतर है।

जेमिनी और पेरप्लेक्सिटी दोनों ने अपनी सामान्य सूचियों को जारी रखा, जो विभिन्न आलोचकों के पक्ष और विपक्ष के आधार पर क्रमबद्ध थीं, जो सारांश के रूप में उपयोगी न होते हुए भी जानकारीपरक थीं। विचित्र रूप से, चैटजीपीटी ने इस अनुरोध पर अपनी सबसे लंबी प्रतिक्रिया लिखी, एक लघु निबंध जिसमें समान जानकारी और मूल्यांकन के बारे में एक निष्कर्ष शामिल था, लेकिन एक शैली में एक मिडिल स्कूल के छात्र की बुनियादी अनुच्छेद संरचना के बारे में सीखने की याद ताजा हो गई: विषय वाक्य, सहायक वाक्य और निष्कर्ष।

क्लाउड की प्रतिक्रिया निश्चित रूप से सबसे सशक्त थी, जिसमें सबसे ऊपर सारांश था, उसके बाद स्पष्टीकरण और आलोचकों द्वारा कही गई बातों का संदर्भ था। यह लगभग एक आलोचक द्वारा लिखी गई संक्षिप्त, अकल्पनीय समीक्षा जैसी लग रही थी, जिसे उसने उद्धृत आलोचकों के उद्धरणों से और अधिक नरम बना दिया था। मैं यह महसूस कर रहा था कि अब मुझे यह बेहतर समझ आ गई है कि किसी फिल्म के लिए अपनी अपेक्षाओं को कैसे नियंत्रित किया जाए। पेरू में पैडिंगटन मैं दूसरों की तुलना में अधिक चिंतित था।

खोज के लिए चैटबॉट रैंकिंग

अपने स्वयं के शोध के माध्यम से एआई चैटबॉट्स का परीक्षण करने के बाद, मुझे उनकी ताकत और कमजोरियों की स्पष्ट समझ है। चैटजीपीटी, जेमिनी, पेरप्लेक्सिटी और क्लाउड उन सर्वोत्तम चैटबॉट्स में से हैं जिन्हें मैंने आजमाया है।

वास्तव में इनमें से कोई भी बुरा नहीं है, लेकिन अगर कोई मुझसे पूछे कि ऑनलाइन शोध और जानकारी एकत्र करने के मामले में उन्हें पहले या आखिर में किसे आज़माना चाहिए, तो मैं जानता हूं कि मैं क्या जवाब दूंगा।

मेरे लिए जेमिनी अंतिम स्थान पर आता है, जो कि कुछ हद तक चौंकाने वाला है, क्योंकि गूगल अपने सर्च इंजन के लिए जाना जाता है। हालाँकि, कार्यक्रम की समय-सारणी को संभालने में उनकी विफलता के कारण, उनके अच्छे प्रदर्शन के बावजूद मुझे उनसे दूर रहना पड़ा।

मेरे लिए एक और आश्चर्य की बात यह है कि ChatGPT तीसरे स्थान पर आता है। यह एआई चैटबॉट है जिसका मैं सबसे अधिक उपयोग करता हूं और अच्छी तरह से जानता हूं, लेकिन इसके छोटे उत्तर, जो मुझे आमतौर पर पसंद हैं, शोध के संदर्भ में बहुत सीमित लगे। मुझे यकीन है कि मॉडल बदलने या शब्द गणना निर्धारित करने से यह समस्या हल हो जाएगी, लेकिन यदि आप एआई में नए हैं और इसे अभी तक नहीं जानते हैं, तो बहुत अधिक अनुवर्ती प्रश्न पूछना अच्छा विचार नहीं है।

यह समस्या पेरप्लेक्सिटी के साथ नहीं है। क्रमांकित सूचियाँ बहुत स्पष्ट थीं, और उद्धरण लगभग व्यापक थे। मेरे लिए इसका मुख्य दोष यह है कि यह प्रॉम्प्ट में किसी भी अतिरिक्त चयन के बिना पुनः खोज इंजन बन जाता है। मुझे यह पसंद आया कि उन्होंने जो जानकारी साझा की है उसका प्रमाण दिया है, लेकिन ऐसा लगता है कि वे ए.आई. से जानकारी प्राप्त करने के बजाय लिंक पर क्लिक करने के लिए बहुत उत्सुक हैं।

मुझे उम्मीद नहीं थी कि क्लाउड इस सूची में शीर्ष पर होगा। जबकि मुझे कुल मिलाकर क्लाउड एक अच्छा एआई चैटबॉट लगा, लेकिन हमेशा ऐसा लगा कि यह अपने कुछ प्रतिस्पर्धियों से पीछे है, शायद उनके जितना ही अच्छा, लेकिन किसी तरह अलग। इस परीक्षण के दौरान यह भावना फीकी पड़ गई।

इसमें कुछ खामियां थीं, जैसे कि उत्तर थोड़े लंबे लग रहे थे या बड़े लेख पर ध्यान देने की आवश्यकता थी, जबकि एक या दो वाक्य पर्याप्त थे। लेकिन मुझे यह पसंद आया कि यह वैंकूवर में हुई सभी घटनाओं को समझाने वाला एक सुसंगत वर्णन था या फिल्म आलोचना पर एक निबंध था। पेरू में पैडिंगटन बिना अपनी बात दोहराये।

एआई सहायक उपकरण हैं, किसी रियलिटी शो के प्रतियोगी नहीं, जहां केवल एक ही व्यक्ति जीत सकता है। विभिन्न कार्यों के लिए अलग-अलग योग्यताओं की आवश्यकता होती है। अंततः, चारों AI चैटबॉट और उनकी खोज सुविधाएं उपयोगी हो सकती हैं, लेकिन यदि आप क्लाउड प्रो के लिए 20 डॉलर प्रति माह का भुगतान करने और इसकी खोज क्षमताओं तक पहुंच बनाने के लिए तैयार हैं, तो मैं कहूंगा कि यह वही है जिसकी आपको तलाश थी।

उत्तर छोड़ दें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा।