Microsoft એ રજુ કર્યુ ગજબનું AI મોડલ, કોઈ પણ ટેક્સ્ટને કરી શકશે અવાજમાં કન્વર્ટ

TV9 GUJARATI

TV9 GUJARATI | Edited By: Pankaj Tamboliya

Updated on: Jan 24, 2023 | 2:02 PM

VALL-E માત્ર વ્યક્તિના અવાજમાં લખાણ જ વાંચી શકતું નથી. તેના બદલે તે તમારા ટેક્સ્ટને ભાવનાત્મક સ્પર્શ આપી શકે છે. જો અહેવાલો પર વિશ્વાસ કરવામાં આવે તો, આ પ્રોડક્ટનો ઉપયોગ એક દિવસ હાઈ-એન્ડ ટેસ્ટ-ટુ-સ્પીચ એપ્લિકેશન્સમાં થઈ શકે છે.

Microsoft એ રજુ કર્યુ ગજબનું AI મોડલ, કોઈ પણ ટેક્સ્ટને કરી શકશે અવાજમાં કન્વર્ટ
Microsoft
Image Credit source: File Photo

માઇક્રોસોફ્ટે VALL-E નામનું નવું AI મોડલ રજૂ કર્યું છે. આ મોડેલ તેના પ્રકારની શ્રેષ્ઠ પ્રોડક્ટ્સમાંનું એક સાબિત થઈ શકે છે. આ Microsoft ઉત્પાદન ટેક્સ્ટ-ટુ-સ્પીચ પર કામ કરે છે. એટલે કે તે તમારું લખાણ વાંચી શકે છે, તે પણ ત્રણ સેકન્ડમાં. તેની ક્ષમતા ત્યાં સમાપ્ત થતી નથી. આ મોડલ કોઈપણ વ્યક્તિનો અવાજ કાઢી શકે છે. VALL-E માત્ર વ્યક્તિના અવાજમાં લખાણ જ વાંચી શકતું નથી. તેના બદલે તે તમારા ટેક્સ્ટને ભાવનાત્મક સ્પર્શ આપી શકે છે. જો અહેવાલો પર વિશ્વાસ કરવામાં આવે તો, આ પ્રોડક્ટનો ઉપયોગ એક દિવસ હાઈ-એન્ડ ટેસ્ટ-ટુ-સ્પીચ એપ્લિકેશન્સમાં થઈ શકે છે.

આ પણ વાંચો: Paytm અને Phonepe ને ટક્કર આપવાની તૈયારીમાં Google, જાણો શું છે કંપનીનો પ્લાન

શું છે આ ટેકનોલોજી ?

VALL-E એ માઇક્રોસોફ્ટનો પ્રોજેક્ટ છે, જેની કંપની ન્યુરલ કોડેક લેંગ્વેજ મોડલ કહે છે. સંશોધકોએ તેના વિશે કેટલીક વિગતો શેર કરી છે, જે ચોંકાવનારી છે. તેમણે જણાવ્યું કે VALL-E ને કેવી રીતે તાલીમ આપવામાં આવી છે. આ AI મોડેલે 7 હજારથી વધુ વક્તાઓ પાસેથી 60 હજાર કલાકથી વધુ અંગ્રેજી ભાષાની તાલીમ મેળવી છે. તાલીમ દરમિયાન તે જે અવાજનું અનુકરણ કરે છે, તેના પરિણામો ઓરીજિનલની ખૂબ નજીક છે.

જો ફાયનલ પ્રોડક્ટમાં પણ આવું થાય છે, તો તે વક્તા માટે લખેલું ભાષણ પોતાના અવાજમાં સરળતાથી વાંચી શકશે. તે પણ તે સ્પીચને મશીનની જેમ નહીં પણ માણસની જેમ વાંચી શકે છે. આવી સ્થિતિમાં ડીપફેકની જેમ તેનો દુરુપયોગ પણ થઈ શકે છે.

દુરુપયોગ થઈ શકે છે

સંશોધકોની ટીમે બતાવ્યું છે કે તે VALL-E ના Github પેજ પર કેવી રીતે કાર્ય કરે છે. જો અહેવાલો પર વિશ્વાસ કરવામાં આવે તો તેનું પરિણામ મિશ્ર હતું. એટલે કે, કેટલાક પ્રસંગોએ આ AI મોડેલનું વાંચન મશીન જેવું હતું, જ્યારે કેટલાક પ્રસંગોએ તેનું પરિણામ ચોંકાવનારું હતું. તે માણસની જેમ જ લખેલું લખાણ વાંચ્યું છે. કોઈપણ સ્પીકરના રેકોર્ડ કરેલા અવાજમાં Echo હોય તો પણ આઉટપુટમાં પણ તે જ જોવા મળ્યુ હતું. આ મોડલને સુધારવા માટે માઇક્રોસોફ્ટ ટ્રેનિંગ વધારવા પર વિચાર કરી રહી છે. માઇક્રોસોફ્ટ તેના કોડને ઓપન સોર્સ કરશે નહીં. કંપનીએ સ્વીકાર્યું છે કે તેનો દુરુપયોગ થઈ શકે છે.

Latest News Updates

Follow us on

Related Stories

Most Read Stories

Click on your DTH Provider to Add TV9 Gujarati