അനുമാനത്തെക്കുറിച്ച് ആളുകൾ സംസാരിക്കുമ്പോൾ , അവർ സാധാരണയായി AI "പഠനം" നിർത്തി എന്തെങ്കിലും ചെയ്യാൻ തുടങ്ങുന്ന ഘട്ടത്തെയാണ് സൂചിപ്പിക്കുന്നത്. യഥാർത്ഥ ജോലികൾ. പ്രവചനങ്ങൾ. തീരുമാനങ്ങൾ. പ്രായോഗിക കാര്യങ്ങൾ.
പക്ഷേ, ഗണിത ബിരുദമുള്ള ഷെർലോക്കിനെപ്പോലെ ഉയർന്ന തലത്തിലുള്ള തത്ത്വചിന്താപരമായ നിഗമനമാണ് നിങ്ങൾ സങ്കൽപ്പിക്കുന്നതെങ്കിൽ - അല്ല, ശരിയല്ല. AI അനുമാനം യാന്ത്രികമാണ്. തണുത്തത്, മിക്കവാറും. എന്നാൽ അത്ഭുതകരമാംവിധം അദൃശ്യമായ രീതിയിൽ.
ഇതിനു ശേഷം നിങ്ങൾക്ക് വായിക്കാൻ ഇഷ്ടപ്പെട്ടേക്കാവുന്ന ലേഖനങ്ങൾ:
🔗 AI-യോട് ഒരു സമഗ്ര സമീപനം സ്വീകരിക്കുക എന്നതിന്റെ അർത്ഥമെന്താണ്?
വിശാലവും കൂടുതൽ മനുഷ്യകേന്ദ്രീകൃതവുമായ ചിന്താഗതി മനസ്സിൽ വെച്ചുകൊണ്ട് AI എങ്ങനെ വികസിപ്പിക്കാനും വിന്യസിക്കാനും കഴിയുമെന്ന് പര്യവേക്ഷണം ചെയ്യുക.
🔗 AI-യിൽ LLM എന്താണ്? – വലിയ ഭാഷാ മോഡലുകളിലേക്ക് ആഴത്തിൽ ഇറങ്ങുക.
ഇന്നത്തെ ഏറ്റവും ശക്തമായ AI ഉപകരണങ്ങളുടെ പിന്നിലെ തലച്ചോറുമായി ഇടപഴകുക - വലിയ ഭാഷാ മോഡലുകൾ വിശദീകരിച്ചു.
🔗 AI-യിൽ RAG എന്താണ്? - വീണ്ടെടുക്കൽ-വർദ്ധിപ്പിച്ച ജനറേഷനിലേക്കുള്ള ഒരു ഗൈഡ്
തിരയലിന്റെയും ജനറേഷന്റെയും ശക്തി സംയോജിപ്പിച്ച് കൂടുതൽ മികച്ചതും കൃത്യവുമായ AI പ്രതികരണങ്ങൾ സൃഷ്ടിക്കുന്നത് എങ്ങനെയെന്ന് മനസ്സിലാക്കുക.
🧪 ഒരു AI മോഡലിന്റെ രണ്ട് ഭാഗങ്ങൾ: ആദ്യം, അത് പരിശീലിപ്പിക്കുന്നു - പിന്നീട്, അത് പ്രവർത്തിക്കുന്നു
ഒരു ഏകദേശ താരതമ്യം ഇതാ: പരിശീലനം എന്നത് പാചക പരിപാടികൾ തുടർച്ചയായി കാണുന്നത് പോലെയാണ്. നിഗമനം എന്നത് നിങ്ങൾ ഒടുവിൽ അടുക്കളയിലേക്ക് നടന്നു, ഒരു പാത്രം പുറത്തെടുത്ത്, വീട് കത്തിക്കാതിരിക്കാൻ ശ്രമിക്കുമ്പോഴാണ്.
പരിശീലനത്തിൽ ഡാറ്റ ഉൾപ്പെടുന്നു. ധാരാളം. മോഡൽ ആന്തരിക മൂല്യങ്ങൾ - ഭാരം, പക്ഷപാതം, ആ ലൈംഗികതയില്ലാത്ത ഗണിതശാസ്ത്ര ബിറ്റുകൾ - അത് കാണുന്ന പാറ്റേണുകളെ അടിസ്ഥാനമാക്കി മാറ്റുന്നു. അതിന് ദിവസങ്ങളോ ആഴ്ചകളോ അക്ഷരാർത്ഥത്തിൽ വൈദ്യുതിയുടെ സമുദ്രങ്ങളോ എടുത്തേക്കാം.
പക്ഷേ അനുമാനമോ? അതാണ് ഫലം.
| ഘട്ടം | AI ജീവിത ചക്രത്തിലെ പങ്ക് | സാധാരണ ഉദാഹരണം |
|---|---|---|
| പരിശീലനം | ഡാറ്റ ക്രഞ്ച് ചെയ്തുകൊണ്ട് മോഡൽ സ്വയം ക്രമീകരിക്കുന്നു - ഒരു അന്തിമ പരീക്ഷയ്ക്കായി തിക്കിത്തിരക്കുന്നത് പോലെ | ആയിരക്കണക്കിന് ലേബൽ ചെയ്ത പൂച്ച ചിത്രങ്ങൾ അതിന് തീറ്റ നൽകുന്നു |
| നിഗമനം | മോഡൽ "അറിയാവുന്നത്" ഉപയോഗിച്ച് പ്രവചനങ്ങൾ നടത്തുന്നു - കൂടുതൽ പഠിക്കാൻ അനുവാദമില്ല | ഒരു പുതിയ ഫോട്ടോയെ മെയ്ൻ കൂൺ ആയി തരംതിരിക്കുന്നു |
🔄 അനുമാന സമയത്ത് യഥാർത്ഥത്തിൽ എന്താണ് സംഭവിക്കുന്നത്?
ശരി - അപ്പോൾ എന്താണ് സംഭവിക്കുന്നതെന്ന്, ഏകദേശം പറഞ്ഞാൽ:
-
നിങ്ങൾ അതിന് എന്തെങ്കിലും നൽകുക - ഒരു പ്രോംപ്റ്റ്, ഒരു ഇമേജ്, കുറച്ച് തത്സമയ സെൻസർ ഡാറ്റ.
-
അത് അത് പ്രോസസ്സ് ചെയ്യുന്നു - പഠിച്ചുകൊണ്ടല്ല, മറിച്ച് ഗണിതശാസ്ത്ര പാളികളുടെ ഒരു കൂട്ടത്തിലൂടെ ആ ഇൻപുട്ട് പ്രവർത്തിപ്പിച്ചുകൊണ്ടാണ്.
-
അത് എന്തെങ്കിലും പുറത്തുവിടുന്നു - ഒരു ലേബൽ, ഒരു സ്കോർ, ഒരു തീരുമാനം... അത് പുറത്തുവിടാൻ പരിശീലിപ്പിച്ചതെന്തും.
പരിശീലനം ലഭിച്ച ഒരു ഇമേജ് റെക്കഗ്നിഷൻ മോഡലിനെ ഒരു ബ്ലറി ടോസ്റ്റർ കാണിക്കുന്നത് സങ്കൽപ്പിക്കുക. അത് നിർത്തുന്നില്ല. ചിന്തിക്കുന്നില്ല. പിക്സൽ പാറ്റേണുകൾ പൊരുത്തപ്പെടുത്തുന്നു, ആന്തരിക നോഡുകൾ സജീവമാക്കുന്നു, കൂടാതെ - ബാം - “ടോസ്റ്റർ.” അത്രമാത്രം? അത് അനുമാനമാണ്.
⚖️ അനുമാനം vs. ന്യായവാദം: സൂക്ഷ്മം എന്നാൽ പ്രധാനപ്പെട്ടത്
ദ്രുത സൈഡ്ബാർ - അനുമാനവും യുക്തിയും കൂട്ടിക്കുഴയ്ക്കരുത്. എളുപ്പമുള്ള കെണി.
-
പഠിച്ച ഗണിതത്തെ അടിസ്ഥാനമാക്കിയുള്ള പാറ്റേൺ പൊരുത്തപ്പെടുത്തലാണ് AI-യിലെ അനുമാനം
-
മറുവശത്ത്, ന്യായവാദം
മിക്ക AI മോഡലുകളും? യുക്തിയില്ല. അവർക്ക് മാനുഷിക അർത്ഥത്തിൽ "മനസ്സിലാകുന്നില്ല". സ്ഥിതിവിവരക്കണക്കനുസരിച്ച് എന്താണ് സാധ്യതയെന്ന് അവർ കണക്കാക്കുന്നു. വിചിത്രമെന്നു പറയട്ടെ, ഇത് പലപ്പോഴും ആളുകളെ ആകർഷിക്കാൻ പര്യാപ്തമാണ്.
🌐 അനുമാനം സംഭവിക്കുന്നിടത്ത്: മേഘം അല്ലെങ്കിൽ അഗ്രം - രണ്ട് വ്യത്യസ്ത യാഥാർത്ഥ്യങ്ങൾ
ഈ ഭാഗം വളരെ പ്രധാനപ്പെട്ടതാണ്. ഒരു AI എവിടെ പ്രവർത്തിക്കുന്നു എന്നതിനെ ആശ്രയിച്ചിരിക്കും അനുമാനം - വേഗത, സ്വകാര്യത, ചെലവ്.
| അനുമാന തരം | അപ്സൈഡുകൾ | ദോഷങ്ങൾ | യഥാർത്ഥ ലോക ഉദാഹരണങ്ങൾ |
|---|---|---|---|
| ക്ലൗഡ് അധിഷ്ഠിതം | ശക്തം, വഴക്കമുള്ളത്, വിദൂരമായി അപ്ഡേറ്റ് ചെയ്തത് | ലേറ്റൻസി, സ്വകാര്യതാ അപകടസാധ്യത, ഇന്റർനെറ്റ് ആശ്രിതത്വം | ChatGPT, ഓൺലൈൻ വിവർത്തകർ, ഇമേജ് തിരയൽ |
| എഡ്ജ്-ബേസ്ഡ് | വേഗതയേറിയത്, പ്രാദേശികം, സ്വകാര്യം - ഓഫ്ലൈനിൽ പോലും | കമ്പ്യൂട്ട് പരിമിതമാണ്, അപ്ഡേറ്റ് ചെയ്യാൻ കൂടുതൽ ബുദ്ധിമുട്ടാണ് | ഡ്രോണുകൾ, സ്മാർട്ട് ക്യാമറകൾ, മൊബൈൽ കീബോർഡുകൾ |
നിങ്ങളുടെ ഫോൺ വീണ്ടും "ഡക്കിംഗ്" ഓട്ടോകറക്റ്റ് ചെയ്താൽ - അത് എഡ്ജ് ഇൻഫറൻസാണ്. സിരി നിങ്ങളുടെ ശബ്ദം കേട്ടില്ലെന്ന് നടിച്ച് ഒരു സെർവറിലേക്ക് പിംഗ് ചെയ്താൽ - അത് ക്ലൗഡ് ആണ്.
⚙️ ജോലിസ്ഥലത്തെ നിഗമനം: ദൈനംദിന AI യുടെ ശാന്ത നക്ഷത്രം
അനുമാനം ശബ്ദിക്കുന്നില്ല. അത് പ്രവർത്തിക്കുന്നത്, നിശബ്ദമായി, തിരശ്ശീലയ്ക്ക് പിന്നിൽ:
-
നിങ്ങളുടെ കാർ ഒരു കാൽനടയാത്രക്കാരനെ കണ്ടെത്തുന്നു. (ദൃശ്യ അനുമാനം)
-
നിങ്ങൾ മറന്നുപോയ ഒരു ഗാനം Spotify ശുപാർശ ചെയ്യുന്നു. (മോഡലിംഗ് മുൻഗണന)
-
“bank_support_1002” ൽ നിന്നുള്ള വിചിത്രമായ ഇമെയിലുകൾ ഒരു സ്പാം ഫിൽട്ടർ തടയുന്നു. (ടെക്സ്റ്റ് വർഗ്ഗീകരണം)
അത് വേഗതയുള്ളതാണ്. ആവർത്തിക്കുന്നത്. അദൃശ്യമാണ്. അത് ഒരു ദിവസം ദശലക്ഷക്കണക്കിന് - അല്ല, കോടിക്കണക്കിന് - തവണ സംഭവിക്കുന്നു.
🧠 അനുമാനം ഒരു വലിയ കാര്യമാകുന്നത് എന്തുകൊണ്ട്?
മിക്ക ആളുകളും നഷ്ടപ്പെടുത്തുന്ന കാര്യം ഇതാണ്: അനുമാനം എന്നത് ഉപയോക്തൃ അനുഭവമാണ്.
നിങ്ങൾക്ക് പരിശീലനം കാണുന്നില്ല. നിങ്ങളുടെ ചാറ്റ്ബോട്ടിന് എത്ര GPU-കൾ ആവശ്യമാണെന്ന് നിങ്ങൾക്ക് പ്രശ്നമില്ല. നാർവാളുകളെക്കുറിച്ചുള്ള നിങ്ങളുടെ വിചിത്രമായ അർദ്ധരാത്രി ചോദ്യത്തിന് അത് തൽക്ഷണം പരിഭ്രാന്തരാകാത്തതും നിങ്ങൾക്ക് പ്രശ്നമാണ്.
കൂടാതെ: അനുമാനം എന്നത് അപകടസാധ്യത കാണിക്കുന്ന ഇടമാണ്. ഒരു മോഡൽ പക്ഷപാതപരമായി പെരുമാറുകയാണെങ്കിൽ? അത് അനുമാനത്തിൽ ദൃശ്യമാകും. അത് സ്വകാര്യ വിവരങ്ങൾ വെളിപ്പെടുത്തുകയാണെങ്കിൽ? അതെ - അനുമാനം. ഒരു സിസ്റ്റം ഒരു യഥാർത്ഥ തീരുമാനം എടുക്കുന്ന നിമിഷം, എല്ലാ പരിശീലന നൈതികതയും സാങ്കേതിക തീരുമാനങ്ങളും ഒടുവിൽ പ്രാധാന്യമർഹിക്കുന്നു.
🧰 അനുമാനം ഒപ്റ്റിമൈസ് ചെയ്യുന്നു: വലുപ്പം (വേഗത) പ്രധാനമാകുമ്പോൾ
അനുമാനം നിരന്തരം പ്രവർത്തിക്കുന്നതിനാൽ, വേഗത പ്രധാനമാണ്. അതിനാൽ എഞ്ചിനീയർമാർ ഇനിപ്പറയുന്നതുപോലുള്ള തന്ത്രങ്ങൾ ഉപയോഗിച്ച് പ്രകടനം ചൂഷണം ചെയ്യുന്നു:
-
ക്വാണ്ടൈസേഷൻ - കമ്പ്യൂട്ടേഷണൽ ലോഡ് കുറയ്ക്കുന്നതിന് സംഖ്യകൾ ചുരുക്കുന്നു.
-
പ്രൂണിംഗ് - മോഡലിന്റെ അനാവശ്യ ഭാഗങ്ങൾ മുറിക്കൽ.
-
ആക്സിലറേറ്ററുകൾ - ടിപിയു, ന്യൂറൽ എഞ്ചിനുകൾ പോലുള്ള പ്രത്യേക ചിപ്പുകൾ.
ഈ മാറ്റങ്ങൾ ഓരോന്നും കുറച്ചുകൂടി വേഗത, കുറച്ചുകൂടി ഊർജ്ജ ഉപയോഗം... കൂടാതെ വളരെ മികച്ച ഉപയോക്തൃ അനുഭവവും നൽകുന്നു.
🧩അനുമാനമാണ് യഥാർത്ഥ പരീക്ഷണം
നോക്കൂ - AI യുടെ മുഴുവൻ ഉദ്ദേശ്യവും മോഡലല്ല. അത് നിമിഷമാണ് . അടുത്ത വാക്ക് പ്രവചിക്കുമ്പോഴോ, സ്കാനിൽ ഒരു ട്യൂമർ കണ്ടെത്തുമ്പോഴോ, അല്ലെങ്കിൽ നിങ്ങളുടെ ശൈലിക്ക് വിചിത്രമായി യോജിക്കുന്ന ഒരു ജാക്കറ്റ് ശുപാർശ ചെയ്യുമ്പോഴോ ഉള്ള ആ അര നിമിഷം.
ആ നിമിഷം? അത് അനുമാനമാണ്.
സിദ്ധാന്തം പ്രവൃത്തിയായി മാറുന്ന സമയമാണിത്. അമൂർത്ത ഗണിതം യഥാർത്ഥ ലോകത്തെ കണ്ടുമുട്ടുകയും ഒരു തിരഞ്ഞെടുപ്പ് നടത്തേണ്ടിവരുകയും ചെയ്യുമ്പോൾ. പൂർണമല്ല. പക്ഷേ വേഗത്തിൽ. നിർണായകമായി.
അതാണ് AI-യുടെ രഹസ്യം: അത് പഠിക്കുന്നു എന്നു മാത്രമല്ല... എപ്പോൾ പ്രവർത്തിക്കണമെന്ന് അതിനറിയാം എന്നതും.