AI എവിടെ നിന്നാണ് വിവരങ്ങൾ ലഭിക്കുന്നത്?

AI-ക്ക് എവിടെ നിന്നാണ് വിവരങ്ങൾ ലഭിക്കുന്നത്?

എപ്പോഴെങ്കിലും തല ചൊറിഞ്ഞുകൊണ്ട് ഇരിക്കുക,... ഇതൊക്കെ എവിടെ നിന്നാണ് വരുന്നത് ? അതായത്, AI പൊടിപിടിച്ച ലൈബ്രറി സ്റ്റാക്കുകളിലൂടെയോ YouTube ഷോർട്ട്‌സിലൂടെയോ വെറുതെ കറങ്ങുന്നില്ല. എന്നിരുന്നാലും, ലസാഗ്ന ഹാക്കുകൾ മുതൽ ബ്ലാക്ക് ഹോൾ ഫിസിക്സ് വരെയുള്ള എല്ലാത്തിനും അത് എങ്ങനെയോ ഉത്തരങ്ങൾ നൽകുന്നു - അതിനുള്ളിൽ ഒരു അടിത്തറയില്ലാത്ത ഫയലിംഗ് കാബിനറ്റ് ഉള്ളതുപോലെ. യാഥാർത്ഥ്യം കൂടുതൽ വിചിത്രവും നിങ്ങൾ ഊഹിക്കുന്നതിലും കൂടുതൽ കൗതുകകരവുമാണ്. നമുക്ക് അത് കുറച്ചുകൂടി തുറക്കാം (അതെ, ഒരുപക്ഷേ വഴിയിൽ രണ്ട് മിത്തുകൾ പൊളിച്ചെഴുതാം).


ഇത് മന്ത്രവാദമാണോ? 🌐

ഇത് മന്ത്രവാദമല്ല, ചിലപ്പോൾ അങ്ങനെ തോന്നുമെങ്കിലും. മറവിൽ സംഭവിക്കുന്നത് അടിസ്ഥാനപരമായി പാറ്റേൺ പ്രവചനമാണ് . വലിയ ഭാഷാ മോഡലുകൾ (LLM-കൾ) വസ്തുതകൾ ; പകരം, മുമ്പ് വന്നതിനെ അടിസ്ഥാനമാക്കി അടുത്ത വാക്ക് (ടോക്കൺ) ഊഹിക്കാൻ അവരെ പരിശീലിപ്പിച്ചിരിക്കുന്നു [2]. പ്രായോഗികമായി, അതിനർത്ഥം അവ ബന്ധങ്ങളുമായി പൊരുത്തപ്പെടുന്നു എന്നാണ്: ഏതൊക്കെ വാക്കുകൾ ഒരുമിച്ച് തങ്ങിനിൽക്കുന്നു, വാക്യങ്ങൾ സാധാരണയായി എങ്ങനെ രൂപം കൊള്ളുന്നു, മുഴുവൻ ആശയങ്ങളും സ്കാർഫോൾഡിംഗ് പോലെ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു. അതുകൊണ്ടാണ് ഔട്ട്‌പുട്ട് തോന്നുന്നത് , പൂർണ്ണ സത്യസന്ധത - അത് മനസ്സിലാക്കലല്ല, സ്റ്റാറ്റിസ്റ്റിക്കൽ മിമിക്രിയാണ് [4].

അപ്പോൾ AI- ജനറേറ്റ് ചെയ്ത വിവരങ്ങൾ യഥാർത്ഥത്തിൽ ഉപയോഗപ്രദമാക്കുന്നത് ? കുറച്ച് കാര്യങ്ങൾ:

  • ഡാറ്റ വൈവിധ്യം - ഒരു ഇടുങ്ങിയ പ്രവാഹത്തിൽ നിന്നല്ല, എണ്ണമറ്റ ഉറവിടങ്ങളിൽ നിന്നാണ് എടുക്കുന്നത്.

  • അപ്‌ഡേറ്റുകൾ - പുതുക്കൽ സൈക്കിളുകൾ ഇല്ലാതെ, ഇത് വേഗത്തിൽ പഴകിപ്പോകും.

  • ഫിൽട്ടറിംഗ് - മാലിന്യം അകത്തു കടക്കുന്നതിനു മുമ്പ് അത് പിടിച്ചെടുക്കുന്നതാണ് ഉത്തമം (എന്നിരുന്നാലും, നമുക്ക് യാഥാർത്ഥ്യമാകാം, വലയിൽ ദ്വാരങ്ങളുണ്ട്).

  • ക്രോസ്-ചെക്കിംഗ് - അധികാര സ്രോതസ്സുകളെ (NASA, WHO, പ്രധാന സർവകലാശാലകൾ എന്നിവ പോലെ) ആശ്രയിക്കുന്നത്, മിക്ക AI ഗവേണൻസ് പ്ലേബുക്കുകളിലും [3] ഉണ്ടായിരിക്കേണ്ട ഒന്നാണ്.

ഭ്രമാത്മകതകൾ എന്ന് വിളിക്കപ്പെടുന്നവ ? അടിസ്ഥാനപരമായി മിനുസപ്പെടുത്തിയ അസംബന്ധം നേരായ മുഖത്തോടെ അവതരിപ്പിക്കുന്നു [2][3].

ഇതിനു ശേഷം നിങ്ങൾക്ക് വായിക്കാൻ ഇഷ്ടപ്പെട്ടേക്കാവുന്ന ലേഖനങ്ങൾ:

🔗 ലോട്ടറി നമ്പറുകൾ പ്രവചിക്കാൻ AI-ക്ക് കഴിയുമോ?
AI ലോട്ടറി പ്രവചനങ്ങളെക്കുറിച്ചുള്ള മിഥ്യകളും വസ്തുതകളും പര്യവേക്ഷണം ചെയ്യുന്നു.

🔗 AI-യോട് സമഗ്രമായ ഒരു സമീപനം സ്വീകരിക്കുക എന്നതിന്റെ അർത്ഥമെന്താണ്?
ധാർമ്മികതയെയും സ്വാധീനത്തെയും കുറിച്ചുള്ള സമതുലിതമായ വീക്ഷണകോണുകളോടെ AI-യെ മനസ്സിലാക്കൽ.

🔗 കൃത്രിമബുദ്ധിയെക്കുറിച്ച് ബൈബിൾ എന്താണ് പറയുന്നത്?
സാങ്കേതികവിദ്യയെയും മനുഷ്യസൃഷ്ടിയെയും കുറിച്ചുള്ള ബൈബിൾ വീക്ഷണങ്ങൾ പരിശോധിക്കുന്നു.


ദ്രുത താരതമ്യം: AI എവിടെ നിന്നാണ് വരുന്നത് 📊

എല്ലാ സ്രോതസ്സുകളും ഒരുപോലെയല്ല, പക്ഷേ ഓരോന്നും അതിന്റേതായ പങ്ക് വഹിക്കുന്നു. ഇതാ ഒരു സ്നാപ്പ്ഷോട്ട് കാഴ്ച.

ഉറവിട തരം ആരാണ് ഇത് ഉപയോഗിക്കുന്നത് (AI) ചെലവ്/മൂല്യം എന്തുകൊണ്ട് ഇത് പ്രവർത്തിക്കുന്നു (അല്ലെങ്കിൽ പ്രവർത്തിക്കുന്നില്ല...)
പുസ്തകങ്ങളും ലേഖനങ്ങളും വലിയ ഭാഷാ മോഡലുകൾ വിലമതിക്കാനാവാത്ത (ഇഷ്) സാന്ദ്രവും ഘടനാപരവുമായ അറിവ് - വേഗത്തിൽ വാർദ്ധക്യമാകുന്നു.
വെബ്‌സൈറ്റുകളും ബ്ലോഗുകളും മിക്കവാറും എല്ലാ AI-കളും സൌജന്യ (ശബ്ദത്തോടെ) വന്യമായ ഇനം; മിഴിവും മാലിന്യവും കലർന്നത്.
അക്കാദമിക് പേപ്പറുകൾ ഗവേഷണ പ്രാധാന്യമുള്ള AI-കൾ ചിലപ്പോൾ പേവാൾഡ് തീവ്രത + വിശ്വാസ്യത, പക്ഷേ കനത്ത പദപ്രയോഗങ്ങൾ ഉൾക്കൊള്ളുന്നു.
ഉപയോക്തൃ ഡാറ്റ വ്യക്തിഗതമാക്കിയ AI-കൾ വളരെ സെൻസിറ്റീവ് ⚠️ തയ്യൽ ഭംഗി കൂടുതലാണ്, പക്ഷേ സ്വകാര്യതയ്ക്ക് തലവേദന കൂടുതലാണ്.
റിയൽ-ടൈം വെബ് തിരയൽ-ലിങ്ക്ഡ് AI-കൾ സൗജന്യം (ഓൺലൈനാണെങ്കിൽ) വിവരങ്ങൾ പുതുതായി സൂക്ഷിക്കുന്നു; പോരായ്മ കിംവദന്തികൾ പ്രചരിപ്പിക്കാനുള്ള സാധ്യതയാണ്.

പരിശീലന ഡാറ്റ പ്രപഞ്ചം 🌌

ഇതാണ് "കുട്ടിക്കാല പഠന" ഘട്ടം. ഒരു കുട്ടിക്ക് ദശലക്ഷക്കണക്കിന് കഥാപുസ്തകങ്ങൾ, വാർത്താ ക്ലിപ്പിംഗുകൾ, വിക്കിപീഡിയ റാബിറ്റ് ഹോളുകൾ എന്നിവയെല്ലാം ഒരേസമയം നൽകുന്നത് സങ്കൽപ്പിക്കുക. പ്രീ-ട്രെയിനിംഗ് അങ്ങനെയാണ് കാണപ്പെടുന്നത്. യഥാർത്ഥ ലോകത്ത്, ദാതാക്കൾ പൊതുവായി ലഭ്യമായ ഡാറ്റ, ലൈസൻസുള്ള ഉറവിടങ്ങൾ, പരിശീലകൻ സൃഷ്ടിച്ച വാചകം [2] എന്നിവ ഒരുമിച്ച് ചേർക്കുന്നു.

മുകളിൽ പാളികളായി നൽകിയിരിക്കുന്നു: ക്യൂറേറ്റ് ചെയ്ത മനുഷ്യ ഉദാഹരണങ്ങൾ - നല്ല ഉത്തരങ്ങൾ, മോശം ഉത്തരങ്ങൾ, ശരിയായ ദിശയിലേക്കുള്ള പ്രേരണകൾ - ശക്തിപ്പെടുത്തൽ ആരംഭിക്കുന്നതിന് മുമ്പ് തന്നെ [1].

സുതാര്യത മുന്നറിയിപ്പ്: കമ്പനികൾ എല്ലാ വിശദാംശങ്ങളും വെളിപ്പെടുത്തില്ല. ചില ഗാർഡ്‌റെയിലുകൾ രഹസ്യമാണ് (ഐപി, സുരക്ഷാ ആശങ്കകൾ), അതിനാൽ യഥാർത്ഥ മിശ്രിതത്തിലേക്ക് നിങ്ങൾക്ക് ഭാഗികമായ ഒരു ജാലകം മാത്രമേ ലഭിക്കൂ [2].


തത്സമയ തിരയൽ: അധിക ടോപ്പിംഗ് 🍒

ചില മോഡലുകൾക്ക് ഇപ്പോൾ അവരുടെ പരിശീലന കുമിളയ്ക്ക് പുറത്തേക്ക് എത്തിനോക്കാൻ കഴിയും. അതായത് വീണ്ടെടുക്കൽ-വർദ്ധിപ്പിച്ച ജനറേഷൻ (RAG) - അടിസ്ഥാനപരമായി ഒരു തത്സമയ സൂചികയിൽ നിന്നോ ഡോക് സ്റ്റോറിൽ നിന്നോ കഷണങ്ങൾ എടുത്ത് മറുപടിയിൽ [5] നെയ്തെടുക്കുന്നു. വാർത്താ തലക്കെട്ടുകൾ അല്ലെങ്കിൽ സ്റ്റോക്ക് വിലകൾ പോലുള്ള വേഗത്തിൽ മാറുന്ന കാര്യങ്ങൾക്ക് അനുയോജ്യം.

കുഴപ്പമുണ്ടോ? ഇന്റർനെറ്റ് ഒരുപോലെ പ്രതിഭയും മാലിന്യക്കൂമ്പാരവുമാണ്. ഫിൽട്ടറുകളോ പ്രൊവിൻസ് പരിശോധനകളോ ദുർബലമാണെങ്കിൽ, നിങ്ങൾ ജങ്ക് ഡാറ്റയിലേക്ക് ഒളിഞ്ഞുനോക്കാൻ സാധ്യതയുണ്ട് - അപകടസാധ്യതാ ചട്ടക്കൂടുകൾ മുന്നറിയിപ്പ് നൽകുന്ന അതേ അവസ്ഥയിലേക്ക് [3].

അവരുടെ സ്വന്തം ബന്ധിപ്പിക്കുന്നു , അതിനാൽ ഉത്തരങ്ങൾ അതിനെ ഒരു വിഭാഗമായി കാണുന്നതിന് പകരം നിലവിലെ എച്ച്ആർ നയമോ അപ്ഡേറ്റ് ചെയ്ത ഉൽപ്പന്ന പ്രമാണമോ ഉദ്ധരിക്കുന്നു. ചിന്തിക്കുക: കുറച്ച് "ഉം-ഓ" നിമിഷങ്ങൾ, കൂടുതൽ വിശ്വസനീയമായ മറുപടികൾ.


ഫൈൻ-ട്യൂണിംഗ്: AI-യുടെ മിനുക്കുപണി ഘട്ടം 🧪

മുൻകൂട്ടി പരിശീലിപ്പിച്ച അസംസ്‌കൃത മോഡലുകൾ വിചിത്രമാണ്. അതിനാൽ അവ മികച്ച രീതിയിൽ ട്യൂൺ :

  • സഹായകരവും, നിരുപദ്രവകരവും, സത്യസന്ധരുമായിരിക്കാൻ അവരെ പഠിപ്പിക്കുക (മനുഷ്യ ഫീഡ്‌ബാക്കിൽ നിന്നുള്ള ശക്തിപ്പെടുത്തൽ പഠനത്തിലൂടെ, RLHF) [1].

  • സുരക്ഷിതമല്ലാത്തതോ വിഷാംശം നിറഞ്ഞതോ ആയ അരികുകൾ പൊടിച്ച് നീക്കം ചെയ്യുക (അലൈൻമെന്റ്) [1].

  • സ്വരത്തിനനുസരിച്ച് ക്രമീകരിക്കുക - അത് സൗഹൃദപരമോ, ഔപചാരികമോ, കളിയായ പരിഹാസമോ ആകട്ടെ.

ഒരു വജ്രത്തെ മിനുസപ്പെടുത്തുകയല്ല, മറിച്ച് ഒരു സ്ഥിതിവിവരക്കണക്ക് ഹിമപാതത്തെ ഒരു സംഭാഷണ പങ്കാളിയെപ്പോലെ പെരുമാറുന്നതിലേക്ക് ആകർഷിക്കുക എന്നതാണ്.


തിരിച്ചടികളും പരാജയങ്ങളും 🚧

ഇത് കുറ്റമറ്റതാണെന്ന് നമുക്ക് നടിക്കരുത്:

  • ഭ്രമാത്മകത - പൂർണ്ണമായും തെറ്റായ വ്യക്തമായ ഉത്തരങ്ങൾ [2][3].

  • പക്ഷപാതം - ഇത് ഡാറ്റയിലേക്ക് പാകപ്പെടുത്തിയ പാറ്റേണുകളെ പ്രതിഫലിപ്പിക്കുന്നു; അൺചെക്ക് ചെയ്‌താൽ പോലും അവയെ ആംപ്ലിഫൈ ചെയ്യാൻ കഴിയും [3][4].

  • നേരിട്ട് പരിചയമില്ല സൂപ്പ് പാചകക്കുറിപ്പുകളെക്കുറിച്ച് പറയാൻ കഴിയും

  • അമിത ആത്മവിശ്വാസം - ഗദ്യം അത് അറിയുന്നതുപോലെ ഒഴുകുന്നു, അത് അറിയാത്തപ്പോൾ പോലും. അപകടസാധ്യതാ ചട്ടക്കൂടുകൾ അനുമാനങ്ങളെ ദുർബലപ്പെടുത്തുന്നു [3].


തോന്നുന്നത് എന്തുകൊണ്ട് 🧠

അതിന് വിശ്വാസങ്ങളില്ല, മനുഷ്യബോധത്തിൽ ഓർമ്മയില്ല, തീർച്ചയായും സ്വത്വവുമില്ല. എന്നിട്ടും അത് വാക്യങ്ങൾ സുഗമമായി കൂട്ടിയിണക്കുന്നതിനാൽ, നിങ്ങളുടെ മസ്തിഷ്കം അത് മനസ്സിലാക്കുന്നതുപോലെ . സംഭവിക്കുന്നത് വെറും വമ്പിച്ച തോതിലുള്ള അടുത്ത-ടോക്കൺ പ്രവചനമാണ് : സ്പ്ലിറ്റ്-സെക്കൻഡുകളിൽ ട്രില്യൺ കണക്കിന് സാധ്യതകൾ തകർക്കുന്നു [2].

"ബുദ്ധിശക്തി" എന്ന പ്രതിഭാസം ഉയർന്നുവരുന്ന പെരുമാറ്റരീതിയാണ് - ഗവേഷകർ ഇതിനെ "സ്റ്റോക്കാസ്റ്റിക് പാരറ്റ്" പ്രഭാവം എന്ന് വിളിക്കുന്നു [4].


കുട്ടികൾക്ക് അനുയോജ്യമായ സാമ്യം 🎨

ലൈബ്രറിയിലെ എല്ലാ പുസ്തകങ്ങളും വായിച്ച ഒരു തത്തയെ സങ്കൽപ്പിക്കുക. അതിന് മനസ്സിലാകുന്നില്ല , പക്ഷേ വാക്കുകൾ യുക്തിസഹമായി തോന്നുന്ന ഒന്നിലേക്ക് റീമിക്സ് ചെയ്യാൻ കഴിയും. ചിലപ്പോൾ അത് കൃത്യമാണ്; ചിലപ്പോൾ അത് അസംബന്ധമാണ് - പക്ഷേ മതിയായ വൈദഗ്ദ്ധ്യം ഉണ്ടെങ്കിൽ, നിങ്ങൾക്ക് എല്ലായ്പ്പോഴും വ്യത്യാസം പറയാൻ കഴിയില്ല.


ചുരുക്കത്തിൽ: AI-യുടെ വിവരങ്ങൾ എവിടെ നിന്ന് വരുന്നു 📌

ലളിതമായി പറഞ്ഞാൽ:

  • ബൃഹത്തായ പരിശീലന ഡാറ്റ (പൊതു + ലൈസൻസുള്ള + പരിശീലകർ സൃഷ്ടിച്ചത്) [2].

  • സ്വരം/പെരുമാറ്റം രൂപപ്പെടുത്തുന്നതിന് മനുഷ്യ ഫീഡ്‌ബാക്ക് ഉപയോഗിച്ച് ഫൈൻ-ട്യൂണിംഗ്

  • തത്സമയ ഡാറ്റ സ്ട്രീമുകളുമായി ബന്ധിപ്പിക്കുമ്പോൾ വീണ്ടെടുക്കൽ സിസ്റ്റങ്ങൾ

AI-ക്ക് കാര്യങ്ങൾ "അറിയില്ല" - അത് വാചകം പ്രവചിക്കുന്നു . അതാണ് അതിന്റെ സൂപ്പർ പവറും അതിന്റെ അക്കില്ലസിന്റെ കുതികാൽ. ചുരുക്കത്തിൽ? വിശ്വസനീയമായ ഒരു ഉറവിടവുമായി എപ്പോഴും പ്രധാനപ്പെട്ട കാര്യങ്ങൾ താരതമ്യം ചെയ്യുക [3].


അവലംബം

  1. ഔയാങ്, എൽ. തുടങ്ങിയവർ (2022). മാനുഷിക ഫീഡ്‌ബാക്ക് ഉപയോഗിച്ച് നിർദ്ദേശങ്ങൾ പാലിക്കുന്നതിന് ഭാഷാ മോഡലുകളെ പരിശീലിപ്പിക്കൽ (InstructGPT) . arXiv .

  2. ഓപ്പൺഎഐ (2023). ജിപിടി-4 സാങ്കേതിക റിപ്പോർട്ട് - ലൈസൻസുള്ളതും, പൊതുവായതും, മനുഷ്യൻ സൃഷ്ടിച്ചതുമായ ഡാറ്റയുടെ മിശ്രിതം; അടുത്ത ടോക്കൺ പ്രവചന ലക്ഷ്യവും പരിമിതികളും. arXiv .

  3. NIST (2023). AI റിസ്ക് മാനേജ്മെന്റ് ഫ്രെയിംവർക്ക് (AI RMF 1.0) - ഉറവിടം, വിശ്വാസ്യത, അപകടസാധ്യത നിയന്ത്രണങ്ങൾ. PDF .

  4. ബെൻഡർ, ഇ.എം., ഗെബ്രു, ടി., മക്മില്ലൻ-മേജർ, എ., മിച്ചൽ, എസ്. (2021). സ്റ്റോക്കാസ്റ്റിക് തത്തകളുടെ അപകടങ്ങളെക്കുറിച്ച്: ഭാഷാ മോഡലുകൾ വളരെ വലുതാകാൻ കഴിയുമോ? PDF .

  5. ലൂയിസ്, പി. തുടങ്ങിയവർ (2020). അറിവ് വർദ്ധിപ്പിക്കുന്ന തലമുറയ്ക്കുള്ള അറിവ് വർദ്ധിപ്പിക്കുന്ന NLP . arXiv .


ഔദ്യോഗിക AI അസിസ്റ്റന്റ് സ്റ്റോറിൽ ഏറ്റവും പുതിയ AI കണ്ടെത്തുക

ഞങ്ങളേക്കുറിച്ച്

ബ്ലോഗിലേക്ക് മടങ്ങുക