AI എവിടെ നിന്നാണ് വിവരങ്ങൾ ലഭിക്കുന്നത്?

AI-ക്ക് എവിടെ നിന്നാണ് വിവരങ്ങൾ ലഭിക്കുന്നത്?

എപ്പോഴെങ്കിലും തല ചൊറിഞ്ഞുകൊണ്ട് ഇരിക്കുക,... ഇതൊക്കെ എവിടെ നിന്നാണ് വരുന്നത്? അതായത്, AI പൊടിപിടിച്ച ലൈബ്രറി സ്റ്റാക്കുകളിലൂടെയോ YouTube ഷോർട്ട്‌സിലൂടെയോ വെറുതെ കറങ്ങുന്നില്ല. എന്നിരുന്നാലും, ലസാഗ്ന ഹാക്കുകൾ മുതൽ ബ്ലാക്ക് ഹോൾ ഫിസിക്സ് വരെയുള്ള എല്ലാത്തിനും അത് എങ്ങനെയോ ഉത്തരങ്ങൾ നൽകുന്നു - അതിനുള്ളിൽ ഒരു അടിത്തറയില്ലാത്ത ഫയലിംഗ് കാബിനറ്റ് ഉള്ളതുപോലെ. യാഥാർത്ഥ്യം കൂടുതൽ വിചിത്രവും നിങ്ങൾ ഊഹിക്കുന്നതിലും കൂടുതൽ കൗതുകകരവുമാണ്. നമുക്ക് അത് കുറച്ചുകൂടി തുറക്കാം (അതെ, ഒരുപക്ഷേ വഴിയിൽ രണ്ട് മിത്തുകൾ പൊളിച്ചെഴുതാം).

ഇത് മന്ത്രവാദമാണോ? 🌐

ഇത് മന്ത്രവാദമല്ല, ചിലപ്പോൾ അങ്ങനെ തോന്നുമെങ്കിലും. മറവിൽ സംഭവിക്കുന്നത് അടിസ്ഥാനപരമായി പാറ്റേൺ പ്രവചനമാണ്. വലിയ ഭാഷാ മോഡലുകൾ (LLM-കൾ) വസ്തുതകൾ ; പകരം, മുമ്പ് വന്നതിനെ അടിസ്ഥാനമാക്കി അടുത്ത വാക്ക് (ടോക്കൺ) ഊഹിക്കാൻ അവരെ പരിശീലിപ്പിച്ചിരിക്കുന്നു [2]. പ്രായോഗികമായി, അതിനർത്ഥം അവ ബന്ധങ്ങളുമായി പൊരുത്തപ്പെടുന്നു എന്നാണ്: ഏതൊക്കെ വാക്കുകൾ ഒരുമിച്ച് തങ്ങിനിൽക്കുന്നു, വാക്യങ്ങൾ സാധാരണയായി എങ്ങനെ രൂപം കൊള്ളുന്നു, മുഴുവൻ ആശയങ്ങളും സ്കാർഫോൾഡിംഗ് പോലെ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു. അതുകൊണ്ടാണ് ഔട്ട്‌പുട്ട് തോന്നുന്നത് , പൂർണ്ണ സത്യസന്ധത - അത് മനസ്സിലാക്കലല്ല, സ്റ്റാറ്റിസ്റ്റിക്കൽ മിമിക്രിയാണ് [4].

അപ്പോൾ AI- ജനറേറ്റ് ചെയ്ത വിവരങ്ങൾ യഥാർത്ഥത്തിൽ ഉപയോഗപ്രദമാക്കുന്നത്? കുറച്ച് കാര്യങ്ങൾ:

ഡാറ്റ വൈവിധ്യം - ഒരു ഇടുങ്ങിയ പ്രവാഹത്തിൽ നിന്നല്ല, എണ്ണമറ്റ ഉറവിടങ്ങളിൽ നിന്നാണ് എടുക്കുന്നത്.
അപ്‌ഡേറ്റുകൾ - പുതുക്കൽ സൈക്കിളുകൾ ഇല്ലാതെ, ഇത് വേഗത്തിൽ പഴകിപ്പോകും.
ഫിൽട്ടറിംഗ് - മാലിന്യം അകത്തു കടക്കുന്നതിനു മുമ്പ് അത് പിടിച്ചെടുക്കുന്നതാണ് ഉത്തമം (എന്നിരുന്നാലും, നമുക്ക് യാഥാർത്ഥ്യമാകാം, വലയിൽ ദ്വാരങ്ങളുണ്ട്).
ക്രോസ്-ചെക്കിംഗ് - അധികാര സ്രോതസ്സുകളെ (NASA, WHO, പ്രധാന സർവകലാശാലകൾ എന്നിവ പോലെ) ആശ്രയിക്കുന്നത്, മിക്ക AI ഗവേണൻസ് പ്ലേബുക്കുകളിലും [3] ഉണ്ടായിരിക്കേണ്ട ഒന്നാണ്.

എന്നിരുന്നാലും, ചിലപ്പോൾ അത് ആത്മവിശ്വാസത്തോടെ കെട്ടിച്ചമയ്ക്കുന്നു. ആ ഭ്രമാത്മകതകൾ എന്ന് വിളിക്കപ്പെടുന്നവ ? അടിസ്ഥാനപരമായി മിനുസപ്പെടുത്തിയ അസംബന്ധം നേരായ മുഖത്തോടെ അവതരിപ്പിക്കുന്നു [2][3].

ഇതിനു ശേഷം നിങ്ങൾക്ക് വായിക്കാൻ ഇഷ്ടപ്പെട്ടേക്കാവുന്ന ലേഖനങ്ങൾ:

🔗 ലോട്ടറി നമ്പറുകൾ പ്രവചിക്കാൻ AI-ക്ക് കഴിയുമോ?
AI ലോട്ടറി പ്രവചനങ്ങളെക്കുറിച്ചുള്ള മിഥ്യകളും വസ്തുതകളും പര്യവേക്ഷണം ചെയ്യുന്നു.

🔗 AI-യോട് സമഗ്രമായ ഒരു സമീപനം സ്വീകരിക്കുക എന്നതിന്റെ അർത്ഥമെന്താണ്?
ധാർമ്മികതയെയും സ്വാധീനത്തെയും കുറിച്ചുള്ള സമതുലിതമായ വീക്ഷണകോണുകളോടെ AI-യെ മനസ്സിലാക്കൽ.

🔗 കൃത്രിമബുദ്ധിയെക്കുറിച്ച് ബൈബിൾ എന്താണ് പറയുന്നത്?
സാങ്കേതികവിദ്യയെയും മനുഷ്യസൃഷ്ടിയെയും കുറിച്ചുള്ള ബൈബിൾ വീക്ഷണങ്ങൾ പരിശോധിക്കുന്നു.

ദ്രുത താരതമ്യം: AI എവിടെ നിന്നാണ് വരുന്നത് 📊

എല്ലാ സ്രോതസ്സുകളും ഒരുപോലെയല്ല, പക്ഷേ ഓരോന്നും അതിന്റേതായ പങ്ക് വഹിക്കുന്നു. ഇതാ ഒരു സ്നാപ്പ്ഷോട്ട് കാഴ്ച.

ഉറവിട തരം	ആരാണ് ഇത് ഉപയോഗിക്കുന്നത് (AI)	ചെലവ്/മൂല്യം	എന്തുകൊണ്ട് ഇത് പ്രവർത്തിക്കുന്നു (അല്ലെങ്കിൽ പ്രവർത്തിക്കുന്നില്ല...)
പുസ്തകങ്ങളും ലേഖനങ്ങളും	വലിയ ഭാഷാ മോഡലുകൾ	വിലമതിക്കാനാവാത്ത (ഇഷ്)	സാന്ദ്രവും ഘടനാപരവുമായ അറിവ് - വേഗത്തിൽ വാർദ്ധക്യമാകുന്നു.
വെബ്‌സൈറ്റുകളും ബ്ലോഗുകളും	മിക്കവാറും എല്ലാ AI-കളും	സൌജന്യ (ശബ്ദത്തോടെ)	വന്യമായ ഇനം; മിഴിവും മാലിന്യവും കലർന്നത്.
അക്കാദമിക് പേപ്പറുകൾ	ഗവേഷണ പ്രാധാന്യമുള്ള AI-കൾ	ചിലപ്പോൾ പേവാൾഡ്	തീവ്രത + വിശ്വാസ്യത, പക്ഷേ കനത്ത പദപ്രയോഗങ്ങൾ ഉൾക്കൊള്ളുന്നു.
ഉപയോക്തൃ ഡാറ്റ	വ്യക്തിഗതമാക്കിയ AI-കൾ	വളരെ സെൻസിറ്റീവ് ⚠️	തയ്യൽ ഭംഗി കൂടുതലാണ്, പക്ഷേ സ്വകാര്യതയ്ക്ക് തലവേദന കൂടുതലാണ്.
റിയൽ-ടൈം വെബ്	തിരയൽ-ലിങ്ക്ഡ് AI-കൾ	സൗജന്യം (ഓൺലൈനാണെങ്കിൽ)	വിവരങ്ങൾ പുതുതായി സൂക്ഷിക്കുന്നു; പോരായ്മ കിംവദന്തികൾ പ്രചരിപ്പിക്കാനുള്ള സാധ്യതയാണ്.

പരിശീലന ഡാറ്റ പ്രപഞ്ചം 🌌

ഇതാണ് "കുട്ടിക്കാല പഠന" ഘട്ടം. ഒരു കുട്ടിക്ക് ദശലക്ഷക്കണക്കിന് കഥാപുസ്തകങ്ങൾ, വാർത്താ ക്ലിപ്പിംഗുകൾ, വിക്കിപീഡിയ റാബിറ്റ് ഹോളുകൾ എന്നിവയെല്ലാം ഒരേസമയം നൽകുന്നത് സങ്കൽപ്പിക്കുക. പ്രീ-ട്രെയിനിംഗ് അങ്ങനെയാണ് കാണപ്പെടുന്നത്. യഥാർത്ഥ ലോകത്ത്, ദാതാക്കൾ പൊതുവായി ലഭ്യമായ ഡാറ്റ, ലൈസൻസുള്ള ഉറവിടങ്ങൾ, പരിശീലകൻ സൃഷ്ടിച്ച വാചകം [2] എന്നിവ ഒരുമിച്ച് ചേർക്കുന്നു.

മുകളിൽ പാളികളായി നൽകിയിരിക്കുന്നു: ക്യൂറേറ്റ് ചെയ്ത മനുഷ്യ ഉദാഹരണങ്ങൾ - നല്ല ഉത്തരങ്ങൾ, മോശം ഉത്തരങ്ങൾ, ശരിയായ ദിശയിലേക്കുള്ള പ്രേരണകൾ - ശക്തിപ്പെടുത്തൽ ആരംഭിക്കുന്നതിന് മുമ്പ് തന്നെ [1].

സുതാര്യത മുന്നറിയിപ്പ്: കമ്പനികൾ എല്ലാ വിശദാംശങ്ങളും വെളിപ്പെടുത്തില്ല. ചില ഗാർഡ്‌റെയിലുകൾ രഹസ്യമാണ് (ഐപി, സുരക്ഷാ ആശങ്കകൾ), അതിനാൽ യഥാർത്ഥ മിശ്രിതത്തിലേക്ക് നിങ്ങൾക്ക് ഭാഗികമായ ഒരു ജാലകം മാത്രമേ ലഭിക്കൂ [2].

തത്സമയ തിരയൽ: അധിക ടോപ്പിംഗ് 🍒

ചില മോഡലുകൾക്ക് ഇപ്പോൾ അവരുടെ പരിശീലന കുമിളയ്ക്ക് പുറത്തേക്ക് എത്തിനോക്കാൻ കഴിയും. അതായത് വീണ്ടെടുക്കൽ-വർദ്ധിപ്പിച്ച ജനറേഷൻ (RAG) -അടിസ്ഥാനപരമായി ഒരു തത്സമയ സൂചികയിൽ നിന്നോ ഡോക് സ്റ്റോറിൽ നിന്നോ കഷണങ്ങൾ എടുത്ത് മറുപടിയിൽ [5] നെയ്തെടുക്കുന്നു. വാർത്താ തലക്കെട്ടുകൾ അല്ലെങ്കിൽ സ്റ്റോക്ക് വിലകൾ പോലുള്ള വേഗത്തിൽ മാറുന്ന കാര്യങ്ങൾക്ക് അനുയോജ്യം.

കുഴപ്പമുണ്ടോ? ഇന്റർനെറ്റ് ഒരുപോലെ പ്രതിഭയും മാലിന്യക്കൂമ്പാരവുമാണ്. ഫിൽട്ടറുകളോ പ്രൊവിൻസ് പരിശോധനകളോ ദുർബലമാണെങ്കിൽ, നിങ്ങൾ ജങ്ക് ഡാറ്റയിലേക്ക് ഒളിഞ്ഞുനോക്കാൻ സാധ്യതയുണ്ട് - അപകടസാധ്യതാ ചട്ടക്കൂടുകൾ മുന്നറിയിപ്പ് നൽകുന്ന അതേ അവസ്ഥയിലേക്ക് [3].

ഒരു പൊതു പരിഹാരം: കമ്പനികൾ മോഡലുകളെ അവരുടെ സ്വന്തം ആന്തരിക ഡാറ്റാബേസുകളുമായി ബന്ധിപ്പിക്കുന്നു , അതിനാൽ ഉത്തരങ്ങൾ അതിനെ ഒരു വിഭാഗമായി കാണുന്നതിന് പകരം നിലവിലെ എച്ച്ആർ നയമോ അപ്ഡേറ്റ് ചെയ്ത ഉൽപ്പന്ന പ്രമാണമോ ഉദ്ധരിക്കുന്നു. ചിന്തിക്കുക: കുറച്ച് "ഉം-ഓ" നിമിഷങ്ങൾ, കൂടുതൽ വിശ്വസനീയമായ മറുപടികൾ.

ഫൈൻ-ട്യൂണിംഗ്: AI-യുടെ മിനുക്കുപണി ഘട്ടം 🧪

മുൻകൂട്ടി പരിശീലിപ്പിച്ച അസംസ്‌കൃത മോഡലുകൾ വിചിത്രമാണ്. അതിനാൽ അവ മികച്ച രീതിയിൽ ട്യൂൺ:

സഹായകരവും, നിരുപദ്രവകരവും, സത്യസന്ധരുമായിരിക്കാൻ അവരെ പഠിപ്പിക്കുക (മനുഷ്യ ഫീഡ്‌ബാക്കിൽ നിന്നുള്ള ശക്തിപ്പെടുത്തൽ പഠനത്തിലൂടെ, RLHF) [1].
സുരക്ഷിതമല്ലാത്തതോ വിഷാംശം നിറഞ്ഞതോ ആയ അരികുകൾ പൊടിച്ച് നീക്കം ചെയ്യുക (അലൈൻമെന്റ്) [1].
സ്വരത്തിനനുസരിച്ച് ക്രമീകരിക്കുക - അത് സൗഹൃദപരമോ, ഔപചാരികമോ, കളിയായ പരിഹാസമോ ആകട്ടെ.

ഒരു വജ്രത്തെ മിനുസപ്പെടുത്തുകയല്ല, മറിച്ച് ഒരു സ്ഥിതിവിവരക്കണക്ക് ഹിമപാതത്തെ ഒരു സംഭാഷണ പങ്കാളിയെപ്പോലെ പെരുമാറുന്നതിലേക്ക് ആകർഷിക്കുക എന്നതാണ്.

തിരിച്ചടികളും പരാജയങ്ങളും 🚧

ഇത് കുറ്റമറ്റതാണെന്ന് നമുക്ക് നടിക്കരുത്:

ഭ്രമാത്മകത - പൂർണ്ണമായും തെറ്റായ വ്യക്തമായ ഉത്തരങ്ങൾ [2][3].
പക്ഷപാതം - ഇത് ഡാറ്റയിലേക്ക് പാകപ്പെടുത്തിയ പാറ്റേണുകളെ പ്രതിഫലിപ്പിക്കുന്നു; അൺചെക്ക് ചെയ്‌താൽ പോലും അവയെ ആംപ്ലിഫൈ ചെയ്യാൻ കഴിയും [3][4].
നേരിട്ട് പരിചയമില്ല - സൂപ്പ് പാചകക്കുറിപ്പുകളെക്കുറിച്ച് പറയാൻ കഴിയും , പക്ഷേ ഒരിക്കലും ഒന്ന് രുചിച്ചിട്ടില്ല [4]
അമിത ആത്മവിശ്വാസം - ഗദ്യം അത് അറിയുന്നതുപോലെ ഒഴുകുന്നു, അത് അറിയാത്തപ്പോൾ പോലും. അപകടസാധ്യതാ ചട്ടക്കൂടുകൾ അനുമാനങ്ങളെ ദുർബലപ്പെടുത്തുന്നു [3].

അറിയുന്നത് പോലെ തോന്നുന്നത് എന്തുകൊണ്ട് 🧠

അതിന് വിശ്വാസങ്ങളില്ല, മനുഷ്യബോധത്തിൽ ഓർമ്മയില്ല, തീർച്ചയായും സ്വത്വവുമില്ല. എന്നിട്ടും അത് വാക്യങ്ങൾ സുഗമമായി കൂട്ടിയിണക്കുന്നതിനാൽ, നിങ്ങളുടെ മസ്തിഷ്കം അത് മനസ്സിലാക്കുന്നതുപോലെ. സംഭവിക്കുന്നത് വെറും വമ്പിച്ച തോതിലുള്ള അടുത്ത-ടോക്കൺ പ്രവചനമാണ്: സ്പ്ലിറ്റ്-സെക്കൻഡുകളിൽ ട്രില്യൺ കണക്കിന് സാധ്യതകൾ തകർക്കുന്നു [2].

"ബുദ്ധിശക്തി" എന്ന പ്രതിഭാസം ഉയർന്നുവരുന്ന പെരുമാറ്റരീതിയാണ് - ഗവേഷകർ ഇതിനെ "സ്റ്റോക്കാസ്റ്റിക് പാരറ്റ്" പ്രഭാവം എന്ന് വിളിക്കുന്നു [4].

കുട്ടികൾക്ക് അനുയോജ്യമായ സാമ്യം 🎨

ലൈബ്രറിയിലെ എല്ലാ പുസ്തകങ്ങളും വായിച്ച ഒരു തത്തയെ സങ്കൽപ്പിക്കുക. അതിന് മനസ്സിലാകുന്നില്ല , പക്ഷേ വാക്കുകൾ യുക്തിസഹമായി തോന്നുന്ന ഒന്നിലേക്ക് റീമിക്സ് ചെയ്യാൻ കഴിയും. ചിലപ്പോൾ അത് കൃത്യമാണ്; ചിലപ്പോൾ അത് അസംബന്ധമാണ് - പക്ഷേ മതിയായ വൈദഗ്ദ്ധ്യം ഉണ്ടെങ്കിൽ, നിങ്ങൾക്ക് എല്ലായ്പ്പോഴും വ്യത്യാസം പറയാൻ കഴിയില്ല.

ചുരുക്കത്തിൽ: AI-യുടെ വിവരങ്ങൾ എവിടെ നിന്ന് വരുന്നു 📌

ലളിതമായി പറഞ്ഞാൽ:

ബൃഹത്തായ പരിശീലന ഡാറ്റ (പൊതു + ലൈസൻസുള്ള + പരിശീലകർ സൃഷ്ടിച്ചത്) [2].
സ്വരം/പെരുമാറ്റം രൂപപ്പെടുത്തുന്നതിന് മനുഷ്യ ഫീഡ്‌ബാക്ക് ഉപയോഗിച്ച് ഫൈൻ-ട്യൂണിംഗ് [1]
തത്സമയ ഡാറ്റ സ്ട്രീമുകളുമായി ബന്ധിപ്പിക്കുമ്പോൾ വീണ്ടെടുക്കൽ സിസ്റ്റങ്ങൾ [5]

AI-ക്ക് കാര്യങ്ങൾ "അറിയില്ല" - അത് വാചകം പ്രവചിക്കുന്നു. അതാണ് അതിന്റെ സൂപ്പർ പവറും അതിന്റെ അക്കില്ലസിന്റെ കുതികാൽ. ചുരുക്കത്തിൽ? വിശ്വസനീയമായ ഒരു ഉറവിടവുമായി എപ്പോഴും പ്രധാനപ്പെട്ട കാര്യങ്ങൾ താരതമ്യം ചെയ്യുക [3].

അവലംബം

ഔയാങ്, എൽ. തുടങ്ങിയവർ (2022). മാനുഷിക ഫീഡ്‌ബാക്ക് ഉപയോഗിച്ച് നിർദ്ദേശങ്ങൾ പാലിക്കുന്നതിന് ഭാഷാ മോഡലുകളെ പരിശീലിപ്പിക്കൽ (InstructGPT). arXiv.
ഓപ്പൺഎഐ (2023). ജിപിടി-4 സാങ്കേതിക റിപ്പോർട്ട് - ലൈസൻസുള്ളതും, പൊതുവായതും, മനുഷ്യൻ സൃഷ്ടിച്ചതുമായ ഡാറ്റയുടെ മിശ്രിതം; അടുത്ത ടോക്കൺ പ്രവചന ലക്ഷ്യവും പരിമിതികളും. arXiv.
NIST (2023). AI റിസ്ക് മാനേജ്മെന്റ് ഫ്രെയിംവർക്ക് (AI RMF 1.0) - ഉറവിടം, വിശ്വാസ്യത, അപകടസാധ്യത നിയന്ത്രണങ്ങൾ. PDF.
ബെൻഡർ, ഇ.എം., ഗെബ്രു, ടി., മക്മില്ലൻ-മേജർ, എ., മിച്ചൽ, എസ്. (2021). സ്റ്റോക്കാസ്റ്റിക് തത്തകളുടെ അപകടങ്ങളെക്കുറിച്ച്: ഭാഷാ മോഡലുകൾ വളരെ വലുതാകുമോ? PDF.
ലൂയിസ്, പി. തുടങ്ങിയവർ (2020). അറിവ് വർദ്ധിപ്പിക്കുന്ന തലമുറയ്ക്കുള്ള അറിവ് വർദ്ധിപ്പിക്കുന്ന NLP. arXiv.

ഔദ്യോഗിക AI അസിസ്റ്റന്റ് സ്റ്റോറിൽ ഏറ്റവും പുതിയ AI കണ്ടെത്തുക

ഞങ്ങളേക്കുറിച്ച്

ബ്ലോഗിലേക്ക് മടങ്ങുക