🧠 'ഏജന്റ് യുഗ'ത്തിനായി ചൈനയുടെ ബൈറ്റ്ഡാൻസ് ഡൗബാവോ 2.0 AI മോഡൽ പുറത്തിറക്കി ↗
"ചാറ്റ് ടു ആൻസർസ്" എന്നതിൽ നിന്ന് "AI ദോ ഡൗസ് സ്റ്റഫ്" എന്നതിലേക്കുള്ള ഒരു പിവറ്റ് ആയിട്ടാണ് ബൈറ്റ്ഡാൻസ് ഡൗബാവോ 2.0 പുറത്തിറക്കിയത് - മൾട്ടി-സ്റ്റെപ്പ് ടാസ്ക്കുകൾ, കൂടുതൽ ശക്തമായ ന്യായവാദം, കൂടുതൽ ഏജന്റ്-ലീനിംഗ് വർക്ക്ഫ്ലോകൾ (ഇപ്പോൾ എല്ലാവരുടെയും ബിൽഡിംഗ് ഏജന്റുമാരാണ്, പ്രത്യക്ഷത്തിൽ).
മുൻനിര മോഡലുകളുമായി താരതമ്യപ്പെടുത്താവുന്ന ശേഷിയുണ്ടെങ്കിലും പ്രവർത്തിപ്പിക്കാൻ വിലകുറഞ്ഞതാണെന്ന വ്യക്തമായ അവകാശവാദവും അവർ ഉന്നയിക്കുന്നുണ്ട്. ആ വിലയുടെ കോണാണ് കഥ... അല്ലെങ്കിൽ ഒരു ബെഞ്ച്മാർക്കിംഗ് ഭക്ഷണ പോരാട്ടത്തിനുള്ള ആരംഭ മണി.
🎆 ഡീപ്സീക്കിന് ഒരു വർഷത്തിനുശേഷം ചൈനീസ് AI മോഡലുകൾ വസന്തോത്സവത്തിൽ അണിനിരക്കുന്നു ↗
ചൈനയുടെ AI രംഗം ആ "വലിയ അവധിക്കാല ലോഞ്ച് കൂമ്പാരം" ചെയ്യുന്നു - ധാരാളം മോഡൽ അപ്ഡേറ്റുകൾ, ധാരാളം ആക്കം കൂട്ടൽ, ആരും വീണ്ടും അത്ഭുതപ്പെടാൻ ആഗ്രഹിക്കാത്ത ഒരു സ്പഷ്ടമായ ബോധം.
ചാറ്റ്ബോട്ടുകൾ, ദൈർഘ്യമേറിയ സന്ദർഭ അപ്ഗ്രേഡുകൾ, മൊബൈൽ-സൗഹൃദ കംപ്രസ്ഡ് മോഡലുകൾ, ഓപ്പൺ സോഴ്സ് റിലീസുകൾ, ചൈനയ്ക്ക് പുറത്തും ശ്രദ്ധ ആകർഷിക്കുന്ന വീഡിയോ ജനറേഷൻ എന്നിവയെല്ലാം ഈ മിശ്രിതത്തിന്റെ സവിശേഷതയാണ്. ഓരോ റോക്കറ്റും "ഞാൻ അടുത്തത്, ഞാൻ അടുത്തത്" എന്ന് വിളിച്ചുപറയുന്ന ഒരു വെടിക്കെട്ട് പ്രദർശനം പോലെയാണ് ഇത് വായിക്കുന്നത്
🪙 AI ബബിൾ ഭയം പുതിയ ഡെറിവേറ്റീവുകൾ സൃഷ്ടിക്കുന്നു ↗
AI ആയുധ മത്സരത്തിന് ധനസഹായം നൽകുന്നതിന് ഏറ്റവും വലിയ സാങ്കേതിക കളിക്കാർ എത്ര തുക വായ്പയെടുക്കുമെന്ന് അറിയാതെ കടം വാങ്ങുന്നവർ ആശങ്കാകുലരാണ് - അതിനാൽ, സ്വാഭാവികമായും, വിപണി ആ ഉത്കണ്ഠയെ മറികടക്കാൻ പുതിയ വഴികൾ കണ്ടെത്തുകയാണ്.
"ഒരു ഭയം നിലനിൽക്കുകയാണെങ്കിൽ, ആരെങ്കിലും അതിനെ സുരക്ഷിതമാക്കും" എന്നത് വളരെ ബുദ്ധിപരവും അൽപ്പം ശപിക്കപ്പെട്ടതുമാണ്... കൊടുങ്കാറ്റ് മേഘങ്ങളെ കുപ്പിയിലാക്കി സബ്സ്ക്രിപ്ഷൻ വഴി വിൽക്കുന്നത് പോലെ.
🪖 വെനിസ്വേലയിലെ റെയ്ഡിൽ യുഎസ് സൈന്യം ആന്ത്രോപിക്സിന്റെ AI മോഡൽ ക്ലോഡ് ഉപയോഗിച്ചതായി റിപ്പോർട്ട് ↗
ഒരു പങ്കാളിത്ത ചാനൽ വഴി വെനിസ്വേലയിൽ രഹസ്യമായി നടത്തിയ ഒരു ഓപ്പറേഷനിൽ ക്ലോഡിനെ ഉപയോഗിച്ചതായി ഒരു റിപ്പോർട്ട് അവകാശപ്പെടുന്നു - ഇത് "മോഡൽ പോളിസി" വാദങ്ങളെ ലാബിൽ നിന്ന് വേഗത്തിൽ പ്രവർത്തന മേഖലയിലേക്ക് കൊണ്ടുപോകുന്നു.
വിശദാംശങ്ങൾ തലക്കെട്ടുകളേക്കാൾ ഇടുങ്ങിയതാണെങ്കിൽ പോലും (പലപ്പോഴും അങ്ങനെയാണ്), വലിയ കാര്യം ഉറച്ചുനിൽക്കുന്നു: മോഡലുകൾ പ്രതിരോധ വർക്ക്ഫ്ലോകളിലേക്ക് പ്രവേശിച്ചുകഴിഞ്ഞാൽ, "ആരാണ് എന്ത് നിയന്ത്രിക്കുന്നത്" എന്നത് കുഴപ്പത്തിലാകുന്നു - അല്ലാതെ ഭംഗിയുള്ളതും തുടക്കത്തിലുള്ളതുമായ രീതിയിലല്ല.
🇮🇳 🧩 എൻവിഡിയ സിഇഒ ഹുവാങ് അടുത്തയാഴ്ച ഇന്ത്യ എഐ ഉച്ചകോടിയിൽ പങ്കെടുക്കില്ലെന്ന് കമ്പനി അറിയിച്ചു ↗
"അപ്രതീക്ഷിത സാഹചര്യങ്ങൾ" കാരണം ജെൻസൺ ഹുവാങ് ഇന്ത്യയിലെ AI ഇംപാക്ട് ഉച്ചകോടിയിൽ പങ്കെടുക്കില്ലെന്ന് എൻവിഡിയ പറയുന്നു, പകരം ഒരു മുതിർന്ന പ്രതിനിധി സംഘം പങ്കെടുക്കും. അതൊരു ശ്രദ്ധേയമായ മാറ്റമാണ്, കാരണം അദ്ദേഹത്തിന്റെ സാന്നിധ്യം അടിസ്ഥാനപരമായി ഒരു പ്രധാന കാന്തമായിരുന്നു.
പരിപാടി ഇപ്പോഴും അടുക്കി വച്ചിരിക്കുന്നതായി തോന്നുന്നു, തീർച്ച - പക്ഷേ, എല്ലാവരും അങ്ങനെ ചെയ്യുന്നില്ലെന്ന് നടിക്കുമ്പോഴും, വലിയ തോതിലുള്ള റദ്ദാക്കലുകൾ മുറിയിലെ താപനിലയിൽ അൽപ്പം മാറ്റം വരുത്താറുണ്ട്.
പതിവുചോദ്യങ്ങൾ
ബൈറ്റ്ഡാൻസിന്റെ ഡൗബാവോ 2.0 ഉം "ഏജന്റ് യുഗ" മാറ്റവും
"ഉത്തരം നൽകുന്ന ചാറ്റ്" എന്നതിൽ നിന്ന് "കാര്യങ്ങൾ ചെയ്യുന്ന AI" എന്നതിലേക്കുള്ള ഒരു പിവറ്റ് ആയിട്ടാണ് ഡൂബാവോ 2.0 രൂപപ്പെടുത്തിയിരിക്കുന്നത്, മൾട്ടി-സ്റ്റെപ്പ് ടാസ്ക്കുകളിലും കൂടുതൽ ഏജന്റ്-ചായ്വുള്ള വർക്ക്ഫ്ലോകളിലും ഊന്നൽ നൽകുന്നു. പ്രായോഗികമായി, ഒരൊറ്റ മറുപടി നൽകുന്നതിനേക്കാൾ ആസൂത്രണം ചെയ്യുന്നതിലും, ക്രമങ്ങളിലൂടെ ന്യായവാദം ചെയ്യുന്നതിലും, നിരവധി ഘട്ടങ്ങളിലൂടെ ഒരു ടാസ്ക് നിർവഹിക്കുന്നതിലും ഇത് കൂടുതൽ ശക്തമാണെന്ന് അവതരിപ്പിക്കപ്പെടുന്നു. "ഏജന്റ് യുഗം" എന്ന ലേബൽ വിശാലമായ ഒരു പാറ്റേണിനെ പ്രതിഫലിപ്പിക്കുന്നു: കൂടുതൽ ടീമുകൾ സംസാരിക്കുന്ന സംവിധാനങ്ങൾ നിർമ്മിക്കുന്നു, മാത്രമല്ല പ്രവർത്തിക്കുന്നു.
Doubao 2.0 ഉപയോഗ കേസുകളിൽ "ഏജന്റ്-ലീനിംഗ് വർക്ക്ഫ്ലോ" എങ്ങനെയിരിക്കും
പല പൈപ്പ്ലൈനുകളിലും, ഒരു ഏജന്റ്-ശൈലിയിലുള്ള സജ്ജീകരണം ഒരു ലക്ഷ്യത്തെ ഘട്ടങ്ങളായി വിഭജിക്കുകയും, ഇന്റർമീഡിയറ്റ് ഫലങ്ങൾ പരിശോധിക്കുകയും, പൂർത്തീകരണം വരെ ആവർത്തിക്കുകയും ചെയ്യുന്നു. ഇതിനർത്ഥം പലപ്പോഴും ഒരു പ്ലാൻ തയ്യാറാക്കുക, ഉപ-ടാസ്ക്കുകൾ സൃഷ്ടിക്കുക, ഒറ്റ-ഷോട്ട് പ്രതികരണത്തേക്കാൾ കൂടുതൽ ഘടനാപരമായ ഒരു അന്തിമ ഔട്ട്പുട്ട് നിർമ്മിക്കുക എന്നിവയാണ്. ഇത് വിലയിരുത്തുന്നതിനുള്ള ഒരു പൊതു മാർഗം ഒന്നിലധികം തീരുമാനങ്ങൾ ആവശ്യമുള്ള ജോലികൾ പ്രവർത്തിപ്പിക്കുക എന്നതാണ് - ഉദാഹരണത്തിന്, ഒരു ചെക്ക്ലിസ്റ്റ് തയ്യാറാക്കുക, അത് പരിഷ്കരിക്കുക, തുടർന്ന് അതിനെ ഒരു ക്ലീൻ ഡെലിവറബിളാക്കി മാറ്റുക.
കുറഞ്ഞ ചെലവിൽ Doubao 2.0 "ടോപ്പ്-ടയർ മോഡലുകളുമായി" പൊരുത്തപ്പെടുന്നുണ്ടോ എന്ന് എങ്ങനെ പരിശോധിക്കാം
ഒരു ഉൽപ്പന്ന വിലയിരുത്തൽ പോലെ ഇതിനെ കൈകാര്യം ചെയ്യുക, ഒരു തലക്കെട്ട് പോലെയല്ല. കൃത്യത, സ്ഥിരത, പരാജയ മോഡുകൾ, എത്ര തവണ വീണ്ടും ശ്രമിക്കണം - എന്നിവയുമായി നിങ്ങൾക്ക് താൽപ്പര്യമുള്ള നിർദ്ദിഷ്ട ജോലികളിൽ Doubao 2.0 താരതമ്യം ചെയ്യുക - ലേറ്റൻസി, ഉപയോഗ ചെലവുകൾ എന്നിവയോടൊപ്പം. കൂടുതൽ പ്രോംപ്റ്റുകൾ, ഭാരമേറിയ ഗാർഡ്റെയിലുകൾ അല്ലെങ്കിൽ കൂടുതൽ മനുഷ്യ അവലോകനം എന്നിവ ആവശ്യമായി വന്നാൽ "വിലകുറഞ്ഞത്" മാറാൻ സാധ്യതയുണ്ട്. ബെഞ്ച്മാർക്കിംഗിൽ, യഥാർത്ഥ വർക്ക്ഫ്ലോകളുമായി സാമ്യമില്ലാത്ത ചെറി-പിക്ക്ഡ് ടെസ്റ്റുകൾക്കായി ശ്രദ്ധിക്കുക.
സ്പ്രിംഗ് ഫെസ്റ്റിവൽ സീസണിൽ ചൈനീസ് AI മോഡലുകൾ ഇത്ര ആക്രമണാത്മകമായി പുറത്തിറങ്ങുന്നത് എന്തുകൊണ്ട്?
റിപ്പോർട്ടിംഗ് ഇതിനെ ഒരു "ലോഞ്ച് പൈൽ-ഓൺ" ആയി ചിത്രീകരിക്കുന്നു: ഒരു പ്രധാന അവധിക്കാല നിമിഷത്തെ ചുറ്റിപ്പറ്റിയുള്ള അപ്ഡേറ്റുകൾ കൂട്ടമായി സംയോജിപ്പിച്ച്, ഒരു ശ്രദ്ധേയമായ കുതിച്ചുചാട്ടം സൃഷ്ടിക്കുന്നു. ഇത് മത്സര സമ്മർദ്ദത്തെയും ട്രാക്ക് ചെയ്യുന്നു - സ്ഥലത്ത് മുമ്പ് ഉണ്ടായ ഒരു "ഷോക്ക്" ന് ശേഷം ആരും അപ്രതീക്ഷിതമായി പിടിക്കപ്പെടാൻ ആഗ്രഹിക്കുന്നില്ല. ലോഞ്ചുകളുടെയും അപ്ഗ്രേഡുകളുടെയും ഒരു വെടിക്കെട്ട് മിശ്രിതമാണ് ഫലം, വേഗത്തിൽ ശ്രദ്ധ പിടിച്ചുപറ്റാൻ ശ്രമിക്കുന്ന ടീമുകൾക്കൊപ്പം.
ദൈർഘ്യമേറിയ സന്ദർഭ അപ്ഗ്രേഡുകൾ, കംപ്രസ് ചെയ്ത മൊബൈൽ മോഡലുകൾ, ഓപ്പൺ സോഴ്സ് റിലീസുകൾ എന്നിവ നിർമ്മാതാക്കൾക്ക് എന്ത് മാറ്റമാണ് വരുത്തുന്നത്
ദീർഘ സന്ദർഭ അപ്ഗ്രേഡുകൾ സാധാരണയായി ഒരൊറ്റ സെഷനിൽ കൂടുതൽ ടെക്സ്റ്റ് അല്ലെങ്കിൽ ചരിത്രം കൈകാര്യം ചെയ്യാൻ ലക്ഷ്യമിടുന്നു, ഇത് വലിയ ഇൻപുട്ടുകളിൽ വിശകലനമോ തുടർച്ചയോ മെച്ചപ്പെടുത്തും. കംപ്രസ് ചെയ്ത മോഡലുകൾ പലപ്പോഴും കർശനമായ കമ്പ്യൂട്ട് ബജറ്റുകളുള്ള ഉപകരണങ്ങളിൽ AI കൂടുതൽ പ്രായോഗികമാക്കുന്നതിനെക്കുറിച്ചാണ്. ഓപ്പൺ സോഴ്സ് റിലീസുകൾക്ക് പരീക്ഷണച്ചെലവ് കുറയ്ക്കാനും ദത്തെടുക്കൽ വിശാലമാക്കാനും കഴിയും, പക്ഷേ അവ വിന്യാസം, സുരക്ഷാ നിയന്ത്രണങ്ങൾ, പരിപാലനം എന്നിവയുടെ ഉത്തരവാദിത്തങ്ങൾ ഉപയോക്താവിലേക്ക് മാറ്റുകയും ചെയ്യുന്നു.
ഭരണത്തിനും റിസ്ക് പ്ലാനിംഗിനും "AI ബബിൾ" ഹെഡ്ജുകളും റിപ്പോർട്ട് ചെയ്യപ്പെട്ട സൈനിക AI ഉപയോഗവും എന്താണ് സൂചിപ്പിക്കുന്നത്
ഡെറിവേറ്റീവ്സ് ആംഗിൾ AI ആയുധ മത്സരത്തിന് എത്രത്തോളം കടം ധനസഹായം നൽകുമെന്നതിനെക്കുറിച്ചുള്ള സാമ്പത്തിക ഉത്കണ്ഠയിലേക്ക് വിരൽ ചൂണ്ടുന്നു, ഇത് ആ അനിശ്ചിതത്വത്തിന് സംരക്ഷണം കണ്ടെത്താൻ വിപണികളെ പ്രേരിപ്പിക്കുന്നു. ക്ലോഡ് പോലുള്ള ഒരു മോഡലിന്റെ റിപ്പോർട്ട് ചെയ്യപ്പെട്ട സൈനിക ഉപയോഗം, "മോഡൽ നയ" ചർച്ചകൾ എത്ര വേഗത്തിൽ പ്രവർത്തന ചോദ്യങ്ങളായി മാറുമെന്ന് അടിവരയിടുന്നു. നേതാക്കൾക്ക്, പ്രായോഗിക സൂചന ശക്തമായ ഭരണം എന്നതാണ്: വ്യക്തമായ ഉപയോഗ നിയന്ത്രണങ്ങൾ, വെണ്ടർ, പങ്കാളി നിയന്ത്രണങ്ങൾ, ഓഡിറ്റ് പാതകൾ, ഉയർന്ന ഓഹരി വിന്യാസം ചിത്രത്തിൽ പ്രവേശിക്കുമ്പോൾ വർദ്ധനവ് വഴികൾ.