ChatGPT 4, Google Gemini கதை முடிஞ்சது.. வந்தது சீனாவின் DeepSeek AI.. அலெர்ட் ஆகும் அமெரிக்கா!


கடந்த பல ஆண்டுகளாக, ஏஐ (AI) என்று சுருக்கமாக அழைக்கப்படும் ஆர்டிபிஷியல் இன்டெலிஜென்ஸ் (Artificial intelligence) தொழில்நுட்பத்தின் ஜாம்பவானாக இருந்துவரும் யுனைடெட் ஸ்டேட்ஸ் ஆஃப் அமெரிக்காவிற்கு போட்டியாக, சீனா அதன் மிகவும் சக்திவாய்ந்த ஓப்பன் சோர்ஸ் ஏஐ மாடல் (Powerful open-source AI model) ஆன டீப்சீக் ஏஐ (DeepSeek AI) மாடலை வெளியிட்டுள்ளது. 

சீனாவின் டீப்சீக் ஏஐ மாடல் ஆனது ஓப்பன் ஏஐ (OpenAI), ஆன்த்ரோபிக் (Anthropic), கூகுள் (Google), மெட்டா (Meta) மற்றும் பல பெரிய ஏஐ தொழில்நுட்ப நிறுவனங்களின் வயிற்றில் புளியை கரைக்கும் அளவிற்கு சக்தி வாய்ந்ததாக உருவாகியுள்ளது,  சீனாவை சேர்ந்த ஏஐ ஆய்வகம் ஆன டீப்சீக் அதன் லார்ஜ் லேங்குவேஜ் மாடல் ஆன டீப்சீக் வி3 மாடலை வெளியிட்டுள்ளது. இது ஓப்பன்ஏஐ, மெட்டா போன்றவற்றின் ஃபிரான்டியர் மாடல்களை (Frontier models) அசெம்பிள் செய்வதற்கு தேவையான செலவில் ஒரு பகுதியை மட்டுமே பயன்படுத்தி உருவாக்கப்பட்டுள்ளது. இன்னும் புரியும்படி சொல்ல வேண்டுமென்றால் டீப்சீக்-வி3 மாடலை உருவாக்க $5.6 மில்லியன் செலவானதாக கூறப்படுகிறது. இது ஓப்பன்ஏஐ, கூகுள் மற்றும் மைக்ரோசாஃப்ட்டால் செலவு செய்யப்பட்ட பல மில்லியன்களுடன் ஒப்பிடுகையில் வியக்கத்தக்க வகையில் குறைவாக உள்ளது. நினைவூட்டும் வண்ணம் சாம் ஆல்ட்மேன் தலைமையிலான ஓப்பன்ஏஐ அதன் ஜிபிடி-4 மாடலை பயிற்றுவிக்க $100 மில்லியன் செலவிட்டதாக கூறப்படுகிறது. 

ஆக ஒப்பீட்டளவில் டீப்சீக் ஆனது 5% செலவில் ரெடியாகியுள்ளது.  அமெரிக்க ஏஐ நிறுவனங்களுக்கு தத்தம் ஏஐ மாடல்களை பயிற்றுவிக்க பில்லியன் கணக்கான டாலர்கள் முதலீடுகள் தேவைப்படும் நேரத்தில், சீனாவில் டீப்சீக் ஆனது வரையறுக்கப்பட்ட வளங்களை உகந்த முறையில் பயன்படுத்துவதில் தலைசிறந்ததாக உள்ளது. இதுதான் அமெரிக்க ஏஐ நிறுவனங்களை இன்னும் கடுப்பாகியுள்ளது. புதுமைகளை உருவாக்க வெறும் முதலீடுகள் தேவைப்படாது, தொலைநோக்கு பார்வையும் தேவை என்பதை டீப்சீக் நிரூபித்துள்ளது!  அமெரிக்காவில் உள்ள ஏஐ நிறுவனங்கள் NVIDIA H100 ஜிபியு-க்கள் போன்ற மேம்பட்ட வன்பொருளின் ஆற்றலை பயன்படுத்தினாலும், டீப்சீக் ஆனது குறைந்த சக்தி வாய்ந்த H800 ஜிபியு-க்களை நம்பியுள்ளது. இந்த பழைய தலைமுறை ஜிபியு-க்களின் செயல்திறனை அதிகரிக்க சில கண்டுபிடிப்பு நுட்பங்களை பயன்படுத்துவதன் மூலம் மட்டுமே இது சாத்தியமாகியிருக்கும். பழைய தலைமுறை ஜிபியு-க்களை தவிர, மல்டி-ஹெட் லேட்டன்ட் அட்டென்ஷன் (Multi-head latent attention) மற்றும் மிக்ஸ்ச்சர்-ஆஃப்-எக்ஸ்பெர்ட்ஸ் (Mixture-of-Experts) போன்ற தொழில்நுட்ப வடிவமைப்புகள் டான் டீப்சீக் மாடல்களை மலிவாக ஆக்குகின்றன. ஏனெனில் இந்த கட்டமைப்புகளுக்கு பயிற்சியளிக்க குறைவான கணக்கீட்டு ஆதாரங்களே (Compute resources) தேவைப்படுகின்றன. டீப்சீக் வி3 ஆனது இப்போது ஓப்பன்ஏஐ-யின் ஜிபிடி-4, ஆன்த்ரோபிக்கின் கிளாட் 3.5 சோனட் (Claude 3.5 Sonnet) மற்றும் மேத்தாவின் எல்லாமா 3.3 (Llama 3.3) போன்ற லார்ஜ் லேங்குவேஜ் மாடல்களை விஞ்சியுள்ளது. இதில் கோட்டிங், கணித சிக்கல்களைத் தீர்ப்பது மற்றும் கோட்டிங்கில் உள்ள பிழைகளைக் கண்டறிவது ஆகிய திறன்களும் அடங்கும். டீப்சீக் வி3 ஒருபக்கம் இருக்க டீப்சீக் ஏஐ ஆய்வகமானது டீப்சீக் ஆர்1 (DeepSeek R1) என்கிற மற்றொரு ரீசனிங் மாடலையும் (Resoning Model) வெளியிட்டுள்ளது. இது கணிதம், கோட்டிங் மற்றும் பொது அறிவு உள்ளிட்ட பல வரையறைகளில் ஓப்பன்ஏஐ நிறுவனத்தின் லேட்டஸ்ட் ஓ1 (O1) மாடலை விஞ்சுகிறது. ஓப்பன் ஏஐ நிறுவனம் தன்னை ஒரு இலாப நோக்கற்ற அமைப்பாக மறுசீரமைத்து கொண்டிருக்கும் இந்த நேரத்தில் சீனாவின் டீப்சீக் ஏஐ ஆனது உலகளாவிய கவனத்தை பெற்றுள்ளதும் இங்கே குறிப்பிடத்தக்கது.

டீப்சீக் ஏஐ ஆய்வகம் அதன் ஏஐ மாடல்களை ஓப்பன் சோர்ஸாக வெளியிட்டுள்ளது. இது ஓப்பன் ஏஐ-க்கு முற்றிலும் எதிரான நடவடிக்கை ஆகும். இப்படி செய்வதன் மூலம் டீப்சீக்கின் உலகளாவிய தாக்கம் அதிகரிக்கும். இதுவொரு ஓப்பன் சோர்ஸ் என்பதால், டெவலப்பர்கள் டீப்சீக்கை எளிமையாக அணுகலாம், மாடலை உருவாக்கலாம், அதை எளிதாக செம்மைப்படுத்தலாம்! Be the first one to Comment

Post a Comment

0 Comments