गूगल ने जेमिनी 2.0 प्रो और फ्लैश-लाइट लॉन्च किया, जो फ्लैश थिंकिंग को यूट्यूब, मैप्स और सर्च से जोड़ेगा

0

गूगल के बड़े भाषा मॉडल (एलएलएम) की जेमिनी श्रृंखला की शुरुआत लगभग एक वर्ष पहले कुछ शर्मनाक गलत-निर्मित छवियों के कारण कठिन रही थी, लेकिन तब से इसमें लगातार सुधार हुआ है, और ऐसा प्रतीत होता है कि कंपनी अपनी दूसरी पीढ़ी के प्रयास - जेमिनी 2.0 - को उपभोक्ताओं और व्यवसायों के लिए अब तक का सबसे बड़ा और सर्वोत्तम बनाने पर आमादा है।

आज, की घोषणा की कंपनी ने जेमिनी 2.0 फ्लैश के सार्वजनिक रिलीज की घोषणा की, जेमिनी 2.0 फ्लैश-लाइट पेश किया, तथा जेमिनी 2.0 प्रो का बीटा संस्करण जारी किया।

डेवलपर्स और व्यवसायों को समर्थन देने के लिए डिज़ाइन किए गए ये मॉडल अब Google AI स्टूडियो और वर्टेक्स AI के माध्यम से उपलब्ध हैं, फ्लैश-लाइट सार्वजनिक पूर्वावलोकन में उपलब्ध है और प्रो प्रारंभिक परीक्षण के लिए उपलब्ध है।

"इन सभी मॉडलों में रिलीज़ के समय टेक्स्ट आउटपुट के साथ मल्टीमीडिया इनपुट की सुविधा होगी, प्लस मीडिया आने वाले महीनों में सामान्य उपयोग के लिए उपलब्ध होगा," गूगल डीपमाइंड सीटीओ कोरे कैवुक्सिओग्लू ने कंपनी के ब्लॉग पोस्ट में घोषणा की घोषणा करते हुए लिखा - यह एक ऐसा लाभ है जो गूगल अपने प्रतिस्पर्धियों के बावजूद ला रहा है। डीपसीक و OpenAI मजबूत प्रतिस्पर्धियों को लांच करने में।

गूगल अपनी मल्टीमीडिया क्षमताओं का लाभ उठाता है

न तो डीपसीक-आर1 और न ही ओपनएआई का नया o3-मिनी मॉडल मल्टीमीडिया इनपुट स्वीकार करें - अर्थात चित्र, फ़ाइल अपलोड या अनुलग्नक।

जबकि आर1 मॉडल उन्हें अपनी वेबसाइट और मोबाइल चैट ऐप पर स्वीकार कर सकता है, यह ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) का उपयोग करता है, जो एक 60 साल से अधिक पुरानी तकनीक है, जो इन अपलोड से केवल पाठ निकालती है - और उनमें से किसी भी अन्य सुविधा को समझ या विश्लेषण नहीं करती है।

हालाँकि, दोनों ही "सोच" मॉडल के एक नए वर्ग का प्रतिनिधित्व करते हैं जो जानबूझकर उत्तरों पर सोचने और "विचार श्रृंखलाओं" और उनके जवाबों की वैधता पर चिंतन करने में अधिक समय लेते हैं। यह जेमिनी 2.0 प्रो श्रृंखला जैसे विशिष्ट बड़े भाषा मॉडल के विपरीत है, इसलिए जेमिनी 2.0 की तुलना डीपसीक-आर1 और ओपनएआई ओ3 से करना सेब और संतरे की तुलना करने जैसा है।

लेकिन आज गूगल की ओर से भी कुछ अच्छी खबरें आईं: गूगल के सीईओ सुंदर पिचाई ने इसकी घोषणा की। एक्स प्लेटफॉर्म एप्लिकेशन अपडेट के बारे में गूगल मिथुन जेमिनी 2.0 फ्लैश थिंकिंग वाले iOS और Android मोबाइल फोन के लिए। इस मॉडल को गूगल मैप्स, यूट्यूब और गूगल सर्च से जोड़ा जा सकता है, जिससे एआई-संचालित खोजों और इंटरैक्शन का एक नया सेट संभव हो सकेगा, जिसका मुकाबला इसके नए प्रतिस्पर्धी, जैसे डीपसीक और ओपनएआई, इन सेवाओं के बिना नहीं कर सकते।

इस लेख को लिखते समय मैंने अपने iPhone पर Google Gemini iOS ऐप पर इसे संक्षेप में आज़माया, और मेरी प्रारंभिक पूछताछ के आधार पर यह प्रभावशाली था, पिछले महीने के शीर्ष 10 सबसे अधिक देखे गए YouTube वीडियो के बीच समानताएं ढूंढी और मुझे आस-पास के डॉक्टरों के कार्यालयों और उनके खुलने/बंद होने के समय की सूची दी, और यह सब कुछ सेकंड के भीतर ही हो गया।

जेमिनी 2.0 फ्लैश पब्लिक रिलीज़

जेमिनी 2.0 फ्लैश मॉडल, जिसे शुरू में बीटा संस्करण के रूप में लॉन्च किया गया था, अब लोकप्रिय हो गया है। दिसंबर में, अब उत्पादन के लिए तैयार है।

अत्यधिक कुशल एआई अनुप्रयोगों के लिए डिज़ाइन किया गया, यह कम विलंबता प्रतिक्रियाएं प्रदान करता है और बड़े पैमाने पर मल्टीमॉडल तर्क का समर्थन करता है।

प्रतिस्पर्धा की तुलना में इसका एक प्रमुख लाभ इसकी संदर्भ विंडो है, या टोकन की वह संख्या है जिसे कोई उपयोगकर्ता किसी प्रोत्साहन में जोड़ सकता है और एलएलएम-संचालित चैटबॉट या एपीआई के साथ एक ही बार में बातचीत करके वापस प्राप्त कर सकता है।

जबकि कई अग्रणी मॉडल, जैसे कि ओपनएआई का नया ओ3-मिनी, जो पिछले सप्ताह शुरू हुआ, 200000 टोकन या उससे कम का समर्थन करता है - जो 400 से 500 पृष्ठ के उपन्यास के बराबर है - जेमिनी 2.0 फ्लैश XNUMX मिलियन टोकन का समर्थन करता है, जिसका अर्थ है कि यह भारी मात्रा में जानकारी को संभाल सकता है, जिससे यह उच्च आवृत्ति, बड़े पैमाने के कार्यों के लिए विशेष रूप से उपयोगी है।

जेमिनी 2.0 फ्लैश-लाइट: कम लागत वाला AI समाधान

जेमिनी 2.0 फ्लैश-लाइट एक बिल्कुल नया बड़ा भाषा मॉडल है जिसका उद्देश्य गुणवत्ता से समझौता किए बिना लागत प्रभावी एआई समाधान प्रदान करना है।

गूगल डीपमाइंड की रिपोर्ट के अनुसार फ्लैश-लाइट अपने पूर्ण आकार (अधिक पैरामीटरयुक्त) पूर्ववर्ती, जेमिनी 1.5 फ्लैश से, MMLU प्रो (77.6% बनाम 67.3%) और बर्ड SQL (57.4% बनाम 45.6%) जैसे बाह्य बेंचमार्क पर बेहतर प्रदर्शन करता है, जबकि इसकी कीमत और गति समान बनी हुई है।

यह मल्टीमीडिया इनपुट का भी समर्थन करता है तथा इसमें पूर्ण फ्लैश मॉडल के समान 1 मिलियन टोकन की संदर्भ विंडो की सुविधा है।

फ्लैश-लाइट वर्तमान में गूगल एआई स्टूडियो और वर्टेक्स एआई के माध्यम से सार्वजनिक पूर्वावलोकन में उपलब्ध है, तथा आने वाले हफ्तों में इसकी सामान्य उपलब्धता की उम्मीद है।

जैसा कि नीचे दी गई तालिका में दिखाया गया है, जेमिनी 2.0 फ्लैश-लाइट की कीमत $0.075 प्रति मिलियन टोकन (इनपुट) और $0.30 प्रति मिलियन टोकन (आउटपुट) है। फ्लैश-लाइट डेवलपर्स के लिए एक बहुत ही किफायती विकल्प है, जो समान लागत संरचना को बनाए रखते हुए अधिकांश बेंचमार्क में जेमिनी 1.5 फ्लैश से बेहतर प्रदर्शन करता है।

 

लोगन किलपैट्रिक ने जेमिनी 2.0 फ्लैश मॉडल की लागत और मूल्य पर प्रकाश डाला। एक्स प्लेटफॉर्म पर पुरुष"जेमिनी 2.0 फ्लैश किसी भी एलएलएम मॉडल का सबसे अच्छा मूल्य है, इसे बनाने का समय आ गया है!"

वास्तव में, प्रदाता एपीआई के माध्यम से उपलब्ध अन्य अग्रणी पारंपरिक एलएलएम मॉडल की तुलना में, जैसे ओपनएआई 4o-मिनी ($0.15/$0.6 प्रति मिलियन I/O टोकन), और एंथ्रोपिक क्लाउड ($0.8/$4! प्रति मिलियन I/O टोकन) और यहां तक ​​कि डीपसीक के पारंपरिक LLM V3 ($0.14/$0.28) के मुकाबले, जेमिनी 2.0 फ्लैश पैसे के लिए सबसे अच्छा मूल्य प्रतीत होता है।

जेमिनी 2.0 प्रो बीटा संदर्भ विंडो में 2 मिलियन आइकन के साथ आता है

जेमिनी 2.0 प्रो (बीटा) मॉडल अब परीक्षण के लिए उपलब्ध है, उन उपयोगकर्ताओं के लिए जिन्हें अधिक उन्नत AI क्षमताओं की आवश्यकता है।

गूगल डीपमाइंड इस मॉडल को प्रोग्रामिंग प्रदर्शन और जटिल संकेतों को संभालने की क्षमता के लिए अपना सबसे शक्तिशाली मॉडल बताता है। इसमें 2 मिलियन अक्षरों की संदर्भ विंडो और उन्नत तर्क क्षमताएं हैं, साथ ही इसमें गूगल सर्च और कोड निष्पादन जैसे बाह्य उपकरणों को एकीकृत करने की क्षमता भी है।

रेड ड्रैगन एआई के सह-संस्थापक और सीईओ तथा गूगल में बाहरी मशीन लर्निंग विकास विशेषज्ञ सैम विटेवेन, जो अक्सर वेंचरबीट के साथ सहयोग करते हैं, ने चर्चा की, यूट्यूब समीक्षा में पेशेवर मॉडल. "नए जेमिनी 2.0 प्रो मॉडल में 1.5 मिलियन-आइकन संदर्भ विंडो है, विजेट, कोड निष्पादन, फ़ंक्शन कॉल और Google खोज के साथ एकीकरण का समर्थन करता है - वह सब कुछ जो हमारे पास प्रो XNUMX में था, लेकिन इसमें सुधार हुआ है।"

उन्होंने एआई विकास के लिए गूगल के पुनरावृत्त दृष्टिकोण की ओर भी इशारा किया: "गूगल की रणनीति में एक महत्वपूर्ण अंतर यह है कि यह मॉडलों के बीटा संस्करण को आम तौर पर उपलब्ध (जीए) होने से पहले ही जारी कर देता है, जिससे फीडबैक के आधार पर तेजी से पुनरावर्तन की अनुमति मिलती है।"

प्रदर्शन मानक जेमिनी 2.0 मॉडल परिवार की क्षमताओं को और अधिक प्रदर्शित करते हैं। उदाहरण के लिए, जेमिनी 2.0 प्रो, तर्क, बहुभाषी समझ और दीर्घ-संदर्भ प्रसंस्करण जैसे कार्यों में फ्लैश और फ्लैश-लाइट से बेहतर प्रदर्शन करता है।

एआई सुरक्षा और भविष्य के विकास

इन अद्यतनों के साथ, गूगल डीपमाइंड अपने जेमिनी 2.0 मॉडलों के लिए नए सुरक्षा उपाय लागू कर रहा है। कंपनी प्रतिक्रिया सटीकता में सुधार करने के लिए सुदृढीकरण सीखने की तकनीकों का लाभ उठाती है, और अपने आउटपुट की समीक्षा और सुधार करने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करती है। इसके अतिरिक्त, अप्रत्यक्ष दावा इंजेक्शन खतरों सहित कमजोरियों की पहचान करने के लिए स्वचालित सुरक्षा परीक्षण का उपयोग किया जाता है।

भविष्य की ओर देखते हुए, गूगल डीपमाइंड जेमिनी 2.0 मॉडल परिवार की क्षमताओं का विस्तार करने की योजना बना रहा है, जिसमें पाठ से परे अतिरिक्त विधियां भी आने वाले महीनों में सामान्य रूप से उपलब्ध होने की उम्मीद है।

इन अद्यतनों के साथ, गूगल एआई विकास में अपने प्रयासों को मजबूत कर रहा है, दक्षता, सामर्थ्य और उन्नत समस्या समाधान के लिए डिजाइन किए गए मॉडलों का एक समूह प्रस्तुत कर रहा है, तथा डीपसीक के उदय के जवाब में अपने स्वयं के मॉडलों का एक समूह प्रस्तुत कर रहा है, जो शक्तिशाली से लेकर बहुत शक्तिशाली और बहुत सस्ते से लेकर थोड़े कम महंगे (लेकिन फिर भी सस्ते) हैं।

क्या यह गूगल को उद्यम एआई बाजार में प्रवेश करने में मदद करने के लिए पर्याप्त होगा, जिस पर पहले ओपनएआई का प्रभुत्व था और अब डीपसीक का प्रभुत्व है? हम इसका अनुसरण करते रहेंगे और आपको बताते रहेंगे!

यदि आप अपने बॉस को प्रभावित करना चाहते हैं, तो वीबी डेली आपकी मदद करेगा। हम आपको संगठनात्मक परिवर्तनों से लेकर व्यावहारिक परिनियोजनों तक, जनरेटिव एआई के साथ कंपनियां क्या कर रही हैं, इसकी अंदरूनी जानकारी देते हैं, ताकि आप अपने ROI को अधिकतम करने के लिए अंतर्दृष्टि साझा कर सकें।

 

उत्तर छोड़ दें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा।