અંગ્રેજી નથી આવડતી? તો AI સાથે ગુજરાતી, હિન્દી કે અન્ય ભાષામાં વાત કરવી પડી શકે છે મોંઘી, જાણો શું છે લૅન્ગ્વેજ ટેક્સ !

જો તમે AI સાથે અંગ્રેજી સિવાયની કોઈપણ ભાષામાં વાત કરો છો તો AI ચેટબોટનો ઉપયોગ કરવાથી તમને વધુ ખર્ચ થઈ શકે છે. OpenAI, Anthropic અને Google જેવી કંપનીઓ ઘણીવાર તેમના નવા AI મોડેલ્સને એવા સાધનો તરીકે રજૂ કરે છે જે દરેક માટે સમાન કાર્ય કરે છે.

| Updated on: Jun 25, 2026 | 8:02 AM
1 / 7
સંશોધકોના નવા ડેટા મુજબ, હિન્દી, અરબી અને ચીની જેવી ભાષાઓમાં AIનો ઉપયોગ કરતા લોકો માટે, અંગ્રેજીમાં AIનો ઉપયોગ કરતા લોકોની સરખામણીએ વધુ ખર્ચ થઈ શકે છે.

સંશોધકોના નવા ડેટા મુજબ, હિન્દી, અરબી અને ચીની જેવી ભાષાઓમાં AIનો ઉપયોગ કરતા લોકો માટે, અંગ્રેજીમાં AIનો ઉપયોગ કરતા લોકોની સરખામણીએ વધુ ખર્ચ થઈ શકે છે.

2 / 7
હિન્દીમાં લખાયેલો એ જ પ્રોમ્પ્ટ અંગ્રેજીની તુલનામાં વધુ ટોકન્સ ઉત્પન્ન કરી શકે છે. ટોકન્સ એ એવી એકમો છે જેનો ઉપયોગ AI સિસ્ટમ લખાણને વાંચવા અને સમજવા માટે કરવામાં આવે છે.

હિન્દીમાં લખાયેલો એ જ પ્રોમ્પ્ટ અંગ્રેજીની તુલનામાં વધુ ટોકન્સ ઉત્પન્ન કરી શકે છે. ટોકન્સ એ એવી એકમો છે જેનો ઉપયોગ AI સિસ્ટમ લખાણને વાંચવા અને સમજવા માટે કરવામાં આવે છે.

3 / 7
સરળ શબ્દોમાં કહીએ તો હિન્દીમાં એક જ વાત કહેવાથી અંગ્રેજી કરતાં AI ટોકન્સ વધુ ખર્ચ થાય છે. આનાથી અંગ્રેજી ન બોલનારાઓ માટે AIનો ઉપયોગ વધુ ખર્ચાળ બને છે.

સરળ શબ્દોમાં કહીએ તો હિન્દીમાં એક જ વાત કહેવાથી અંગ્રેજી કરતાં AI ટોકન્સ વધુ ખર્ચ થાય છે. આનાથી અંગ્રેજી ન બોલનારાઓ માટે AIનો ઉપયોગ વધુ ખર્ચાળ બને છે.

4 / 7
સંશોધકો અને ડેવલપર્સ આ વધારાના ખર્ચને ઘણીવાર લૅન્ગ્વેજ ટેક્સ તરીકે ઓળખાવામાં આવે છે. આ એક પ્રકારનો છુપાયેલો ખર્ચ છે. જે AI મોડલ વિવિધ ભાષાઓને અલગ રીતે પ્રોસેસ કરવાને કારણે થાય છે.

સંશોધકો અને ડેવલપર્સ આ વધારાના ખર્ચને ઘણીવાર લૅન્ગ્વેજ ટેક્સ તરીકે ઓળખાવામાં આવે છે. આ એક પ્રકારનો છુપાયેલો ખર્ચ છે. જે AI મોડલ વિવિધ ભાષાઓને અલગ રીતે પ્રોસેસ કરવાને કારણે થાય છે.

5 / 7
થોડા અઠવાડિયા પહેલાં OpenAIના સંશોધક Aran Komatsuzaki એ એક પ્રયોગ વિશે માહિતી આપી હતી જેમાં OpenAI અને Anthropicના ટોકનાઇઝર્સ વિવિધ ભાષાઓના લખાણને કેવી રીતે પ્રોસેસ કરે છે તે તપાસવામાં આવ્યું હતું.

થોડા અઠવાડિયા પહેલાં OpenAIના સંશોધક Aran Komatsuzaki એ એક પ્રયોગ વિશે માહિતી આપી હતી જેમાં OpenAI અને Anthropicના ટોકનાઇઝર્સ વિવિધ ભાષાઓના લખાણને કેવી રીતે પ્રોસેસ કરે છે તે તપાસવામાં આવ્યું હતું.

6 / 7
AI સંશોધક Rich Suttonના પ્રસિદ્ધ લેખ ધ બિટર લેસનને આધાર બનાવીને, કોમાત્સુઝાકીએ લખાણનું અનેક ભાષાઓમાં અનુવાદ કર્યું અને ત્યારબાદ જુદા જુદા AI સિસ્ટમ્સ કેટલા ટોકન્સ બનાવે છે તેનું વિશ્લેષણ કર્યું.

AI સંશોધક Rich Suttonના પ્રસિદ્ધ લેખ ધ બિટર લેસનને આધાર બનાવીને, કોમાત્સુઝાકીએ લખાણનું અનેક ભાષાઓમાં અનુવાદ કર્યું અને ત્યારબાદ જુદા જુદા AI સિસ્ટમ્સ કેટલા ટોકન્સ બનાવે છે તેનું વિશ્લેષણ કર્યું.

7 / 7
પરિણામે અંગ્રેજી અને અન્ય ભાષાઓ વચ્ચે નોંધપાત્ર તફાવત જોવા મળ્યો છે. વિશ્લેષણ મુજબ, OpenAIના ટોકનાઇઝર પર હિન્દી ટેક્સ્ટને અંગ્રેજી કરતાં 1.37 ગણા વધુ ટોકન્સની જરૂર પડે છે. જો કે, Anthropicના Cloud ટોકનાઇઝર પર આ આંકડો વધીને 3.24 ગણો વધુ ટોકન્સ છે. ક્લાઉડ પર અરબી ભાષાને 2.86 ગણા વધુ ટોકન્સની જરૂર પડી, જ્યારે ચાઇનીઝ ભાષાને 1.71 ગણા વધુ ટોકન્સ વપરાયા.

પરિણામે અંગ્રેજી અને અન્ય ભાષાઓ વચ્ચે નોંધપાત્ર તફાવત જોવા મળ્યો છે. વિશ્લેષણ મુજબ, OpenAIના ટોકનાઇઝર પર હિન્દી ટેક્સ્ટને અંગ્રેજી કરતાં 1.37 ગણા વધુ ટોકન્સની જરૂર પડે છે. જો કે, Anthropicના Cloud ટોકનાઇઝર પર આ આંકડો વધીને 3.24 ગણો વધુ ટોકન્સ છે. ક્લાઉડ પર અરબી ભાષાને 2.86 ગણા વધુ ટોકન્સની જરૂર પડી, જ્યારે ચાઇનીઝ ભાષાને 1.71 ગણા વધુ ટોકન્સ વપરાયા.

Follow Us