Uncategorized

Zoho Developing Energy Efficient Indic LLM

सारांश

सास यूनिकॉर्न ज़ोहो अपने स्वयं के बड़े भाषा मॉडल (एलएलएम) का निर्माण कर रहा है, जो एक सामान्य एआई मॉडल और एक संकेत भाषा मॉडल दोनों पर ध्यान केंद्रित कर रहा है। कंपनी एक मजबूत डेटासेट विकसित करने के लिए IIT, AI4BHARAT और डेटा संग्रह फर्मों के साथ सहयोग कर रही है

Zoho Openai जैसे बड़े पैमाने पर बिजली-भूखे मॉडल के बजाय ऊर्जा-कुशल, दाएं आकार के LLM के लिए नजर गड़ाए हुए है। यह “वर्टिकलाइजेशन,” पर ध्यान केंद्रित कर रहा है, आईटी के लिए फाइन-ट्यूनिंग एआई

वर्तमान में, Zoho ने दावा किया है कि 80 से अधिक आईटी देशी, Bespoke AI एल्गोरिदम को तैनात किया गया है, जो कंपनी के उद्यम आईटी प्रबंधन प्रभाग के दौरान प्रति माह 5 बीएन एपीआई कॉल की प्रक्रिया करता है।

सास यूनिकॉर्न जोहो अपने समूह के सीईओ शैलेश कुमार डेवी ने कहा कि भारतीय भाषाओं पर ध्यान देने के साथ, अपने स्वयं के बड़े भाषा मॉडल (एलएलएम) को विकसित करने पर काम कर रहा है।

सोमवार (3 मार्च) को एक मीडिया राउंडटेबल के दौरान, डेवी ने कहा कि कंपनी का लक्ष्य एलएलएम को अपने उत्पादों में एकीकृत करना है और इसे “सही समय” पर व्यवसायों के लिए उपलब्ध कराना है।

ZOHO वर्तमान में दो AI मॉडल विकसित कर रहा है – एक सामान्य LLM और एक संकेत भाषा मॉडल, विशेष रूप से भारतीय उपयोगकर्ताओं के लिए डिज़ाइन किया गया है। जबकि इस वर्ष सामान्य मॉडल लॉन्च होने की उम्मीद है, इंडिक लैंग्वेज मॉडल के लॉन्च के लिए कोई समयरेखा नहीं है।

कंपनी IITS, AI4BHARAT, और डेटा कलेक्शन फर्मों के साथ एक मजबूत डेटासेट बनाने के लिए कर्या जैसी डेटा संग्रह फर्मों के साथ सहयोग कर रही है।

भारतीय भाषाएं उपलब्ध आंकड़ों की मिश्रित प्रकृति के कारण अद्वितीय चुनौतियां पेश करती हैं, जो अक्सर अंग्रेजी शब्दों और वाक्यांशों के साथ मिलती हैं। इसे संबोधित करने के लिए, कुछ उद्योग खिलाड़ी प्रशिक्षण के लिए सिंथेटिक डेटा पर भरोसा करते हैं। हालांकि, डेवी ने कहा कि ज़ोहो ने अब तक सिंथेटिक डेटा का उपयोग नहीं किया है।

“AI4BHARAT के पास सरकारी डेटा तक पहुंच है और उसने कुछ डेटासेट को क्यूरेट किया है, जिसका उपयोग हम अपने स्वयं के डेटा संग्रह प्रयासों के साथ करते हैं। हम इन डेटासेट का उपयोग करके अपने मॉडल को प्रशिक्षित कर रहे हैं, ”उन्होंने कहा।

AI4BHARAT IIT मद्रास में एक शोध प्रयोगशाला है जो भारतीय भाषाओं के लिए ओपन-सोर्स डेटासेट, उपकरण, मॉडल और अनुप्रयोगों को विकसित करने पर काम करती है।

एक इंडिक एलएलएम विकसित करने में चुनौतियों के बारे में बोलते हुए, डेवी ने कहा, “… उपलब्ध डेटा का अधिकांश हिस्सा अंग्रेजी में है, और भारतीय भाषाओं के लिए टोकनीकरण यूरोपीय भाषाओं से काफी अलग है। यह एक चुनौती प्रस्तुत करता है जिस पर हम सक्रिय रूप से काम कर रहे हैं। भारत में कई कंपनियां इसी तरह के मुद्दों से निपट रही हैं, लेकिन हम उन्हें हल करने के लिए हाथों को पाने में विश्वास करते हैं। जब हम सार्थक प्रगति करेंगे तो हम अधिक जानकारी साझा करेंगे। ”

विशेष रूप से, सामान्य मॉडल के लिए, 7 बीएन मापदंडों के साथ दो संस्करण और 13 बीएन मापदंडों के साथ अन्य होंगे।

जीनई बूम का लाभ उठाते हुए

विकास ऐसे समय में आता है जब जीनई ने तूफान से दुनिया को ले लिया है। इसके बीच, चीन के दीपसेक की सफलता है भारत की अपनी एलएलएम विकसित करने की आवश्यकता के बारे में एक बहस को प्रज्वलित किया।

Zoho ने दीपसेक की पुस्तक से एक पत्ता निकाला है और ऊर्जा और संसाधन कुशल LLMs विकसित करने पर ध्यान केंद्रित कर रहा है। “हमारे LLMS के लिए, हम Openai जैसे बड़े पैमाने पर बिजली के भूखे मॉडल के बारे में नहीं सोच रहे हैं। इसके बजाय, हम अपने एलएलएम को यथासंभव कुशल होने के लिए सही आकार देने पर ध्यान केंद्रित कर रहे हैं, जैसे कि डीपसेक या उससे भी अधिक अनुकूलित। इसका मतलब है कि वे अत्यधिक शक्ति या संसाधनों का उपभोग नहीं करेंगे, ”डेवी ने कहा।

LLM के विकास के अलावा, Zoho Genai बूम का लाभ उठाने के लिए “ऊर्ध्वाधर” पर ध्यान केंद्रित कर रहा है।

एआई मॉडल तेजी से कमोडिटिस हो रहे हैं, बहुत कुछ ओपन-सोर्स मॉडल जैसे कि मेटा के लामा और गले लगाने वाले चेहरे मॉडल। लेकिन, ज़ोहो का मानना ​​है कि विशेष रूप से आईटी अनुप्रयोगों के लिए ठीक-ट्यूनिंग एआई मॉडल में एक बड़ा अवसर है।

कंपनी का मानना ​​है कि इसकी ताकत बीस्पोक फाउंडेशनल एआई मॉडल विकसित करने में निहित है, जैसे कि पीडीएफएस में मैलवेयर डिटेक्शन के लिए विसंगति का पता लगाने, पूर्वानुमान, ज्ञान ग्राफ़ और सुरक्षा एल्गोरिदम, अन्य लोगों के बीच।

वर्तमान में, Zoho ने दावा किया है कि 80 से अधिक आईटी देशी, बीस्पोक एआई एल्गोरिदम को तैनात किया गया है, जो कंपनी के एंटरप्राइज आईटी प्रबंधन प्रभाग के प्रबंधन के दौरान प्रति माह 5 बीएन एपीआई कॉल की प्रक्रिया करता है। यह दावा करता है कि 2023 से 2024 तक एआई उपयोग में वर्ष-दर-वर्ष की वृद्धि देखी गई है।

चुनौतियों पर एक प्रश्न का जवाब देते हुए, डेवी ने कहा, “सही आकार महत्वपूर्ण है, विशेष रूप से बी 2 सी के उपयोग के मामलों में जहां मॉडल को प्रश्नों की एक विस्तृत श्रृंखला को पूरा करना चाहिए और उपयोगकर्ता तत्काल प्रतिक्रियाओं की उम्मीद करते हैं और अक्सर सार्वजनिक रूप से आउटपुट साझा करते हैं, सटीकता और दक्षता को महत्वपूर्ण बनाते हैं।”

इस बीच, Genai के विकास पर टिप्पणी करते हुए, समूह के सीईओ ने कहा कि दीपसेक को एक छोटी अवधि में नहीं बनाया गया था और उनकी टीम से व्यापक प्रयोग और प्रयासों की आवश्यकता थी। उनका मानना ​​है कि एक और पुनरावृत्ति शेष है जब यह फिर से परिभाषित करने की बात आती है कि कैसे मूलभूत मॉडल का निर्माण किया जाना चाहिए।

“जब ऐसा होता है, तो ज़ोहो इसे अपनाने और जल्दी से कार्य करने के लिए तैयार रहना चाहता है,” उन्होंने कहा।

डेवी को हाल ही में ज़ोहो के समूह के सीईओ की भूमिका में पदोन्नत किया गया था श्रीधर वेम्बु ने नीचे कदम रखा जनवरी में मुख्य वैज्ञानिक की भूमिका निभाने और कंपनी की आरएंडडी पहलों पर ध्यान केंद्रित करने के लिए।

LEAVE A RESPONSE

Your email address will not be published. Required fields are marked *