ഒരു AI ഏജന്റിനെ എങ്ങനെ നിർമ്മിക്കാം

ഒരു AI ഏജന്റിനെ എങ്ങനെ നിർമ്മിക്കാം

ചുരുക്ക ഉത്തരം: പ്രായോഗികമായി പ്രവർത്തിക്കുന്ന ഒരു AI ഏജന്റ് നിർമ്മിക്കുന്നതിന്, അതിനെ ഒരു നിയന്ത്രിത ലൂപ്പായി കണക്കാക്കുക: ഇൻപുട്ട് എടുക്കുക, അടുത്ത പ്രവർത്തനം തീരുമാനിക്കുക, ഒരു ഇടുങ്ങിയ സ്കോപ്പ് ഉള്ള ഉപകരണം വിളിക്കുക, ഫലം നിരീക്ഷിക്കുക, വ്യക്തമായ "പൂർത്തിയായി" എന്ന പരിശോധന പാസാകുന്നതുവരെ ആവർത്തിക്കുക. ടാസ്‌ക് മൾട്ടി-സ്റ്റെപ്പും ടൂൾ-ഡ്രൈവണും ആയിരിക്കുമ്പോൾ അത് അതിന്റെ കീപ്പ് നേടുന്നു; ഒരൊറ്റ പ്രോംപ്റ്റ് അത് പരിഹരിച്ചാൽ, ഏജന്റിനെ ഒഴിവാക്കുക. കർശനമായ ടൂൾ സ്കീമകൾ, സ്റ്റെപ്പ് ലിമിറ്റുകൾ, ലോഗിംഗ്, ഒരു വാലിഡേറ്റർ/ക്രിട്ടിക് എന്നിവ ചേർക്കുക, അതുവഴി ഉപകരണങ്ങൾ പരാജയപ്പെടുമ്പോഴോ ഇൻപുട്ടുകൾ അവ്യക്തമാകുമ്പോഴോ, ഏജന്റ് ലൂപ്പിംഗിന് പകരം എസ്കലേറ്റ് ചെയ്യുന്നു.

പ്രധാന കാര്യങ്ങൾ:

കൺട്രോളർ ലൂപ്പ് : വ്യക്തമായ സ്റ്റോപ്പ് അവസ്ഥകളും പരമാവധി ഘട്ടങ്ങളും ഉപയോഗിച്ച് ഇൻപുട്ട്→ആക്ട്→ഒബ്സർവ് ആവർത്തനം നടപ്പിലാക്കുക.

ഉപകരണ രൂപകൽപ്പന : “do_anything” കുഴപ്പങ്ങൾ തടയുന്നതിന് ഉപകരണങ്ങൾ ഇടുങ്ങിയതും, ടൈപ്പ് ചെയ്തതും, അനുവാദം നൽകിയതും, സാധുതയുള്ളതുമായി സൂക്ഷിക്കുക.

മെമ്മറി ശുചിത്വം : ഹ്രസ്വകാല അവസ്ഥയും ദീർഘകാല വീണ്ടെടുക്കലും ഒരുമിച്ച് ഉപയോഗിക്കുക; പൂർണ്ണ ട്രാൻസ്ക്രിപ്റ്റുകൾ ഉപേക്ഷിക്കുന്നത് ഒഴിവാക്കുക.

ദുരുപയോഗ പ്രതിരോധം : അപകടകരമായ പ്രവർത്തനങ്ങൾക്കായി അനുമതി പട്ടികകൾ, നിരക്ക് പരിധികൾ, ഐഡംപോട്ടൻസി, "ഡ്രൈ-റൺ" എന്നിവ ചേർക്കുക.

പരീക്ഷണക്ഷമത : ഒരു സാഹചര്യ സ്യൂട്ട് (പരാജയങ്ങൾ, അവ്യക്തത, കുത്തിവയ്പ്പുകൾ) നിലനിർത്തുകയും ഓരോ മാറ്റത്തിലും വീണ്ടും പ്രവർത്തിപ്പിക്കുകയും ചെയ്യുക.

ഒരു AI ഏജന്റിനെ എങ്ങനെ നിർമ്മിക്കാം? ഇൻഫോഗ്രാഫിക്
ഇതിനു ശേഷം നിങ്ങൾക്ക് വായിക്കാൻ ഇഷ്ടപ്പെട്ടേക്കാവുന്ന ലേഖനങ്ങൾ:

🔗 AI പ്രകടനം എങ്ങനെ അളക്കാം
വേഗത, കൃത്യത, വിശ്വാസ്യത എന്നിവ മാനദണ്ഡമാക്കുന്നതിനുള്ള പ്രായോഗിക അളവുകൾ പഠിക്കുക.

🔗 AI-യോട് എങ്ങനെ സംസാരിക്കാം
മികച്ച ഉത്തരങ്ങൾ ലഭിക്കുന്നതിന് നിർദ്ദേശങ്ങൾ, സന്ദർഭം, തുടർനടപടികൾ എന്നിവ ഉപയോഗിക്കുക.

🔗 AI മോഡലുകളെ എങ്ങനെ വിലയിരുത്താം
ടെസ്റ്റുകൾ, റൂബ്രിക്സ്, യഥാർത്ഥ ലോക ടാസ്‌ക് ഫലങ്ങൾ എന്നിവ ഉപയോഗിച്ച് മോഡലുകൾ താരതമ്യം ചെയ്യുക.

🔗 AI മോഡലുകൾ എങ്ങനെ ഒപ്റ്റിമൈസ് ചെയ്യാം
ട്യൂണിംഗ്, പ്രൂണിംഗ്, മോണിറ്ററിംഗ് എന്നിവയിലൂടെ ഗുണനിലവാരവും ചെലവും മെച്ചപ്പെടുത്തുക.


1) ഒരു AI ഏജന്റ് എന്താണ്, സാധാരണ വ്യക്തിയുടെ വാക്കുകളിൽ 🧠

ഒരു AI ഏജന്റ് ഒരു ലൂപ്പാണ്. ലാങ്‌ചെയിൻ “ഏജന്റുകൾ” ഡോക്‌സ്

അത്രയേയുള്ളൂ. മധ്യത്തിൽ തലച്ചോറുള്ള ഒരു ലൂപ്പ്.

ഇൻപുട്ട് → ചിന്തിക്കുക → പ്രവർത്തിക്കുക → നിരീക്ഷിക്കുക → ആവർത്തിക്കുക . പ്രതികരിക്കുക പേപ്പർ (കാരണം + പ്രവർത്തിക്കുക)

എവിടെ:

  • ഇൻപുട്ട് എന്നത് ഒരു ഉപയോക്തൃ അഭ്യർത്ഥനയോ ഒരു ഇവന്റോ ആണ് (പുതിയ ഇമെയിൽ, പിന്തുണ ടിക്കറ്റ്, സെൻസർ പിംഗ്).

  • അടുത്ത ഘട്ടത്തെക്കുറിച്ചുള്ള ഒരു ഭാഷാ മാതൃകയാണ് തിങ്ക്

  • ആക്റ്റ് ഒരു ടൂൾ വിളിക്കുന്നു (ആന്തരിക ഡോക്സ് തിരയുക, കോഡ് പ്രവർത്തിപ്പിക്കുക, ഒരു ടിക്കറ്റ് സൃഷ്ടിക്കുക, ഒരു മറുപടി ഡ്രാഫ്റ്റ് ചെയ്യുക). OpenAI ഫംഗ്ഷൻ കോളിംഗ് ഗൈഡ്

  • ഒബ്സർവ് ടൂൾ ഔട്ട്പുട്ട് വായിക്കുന്നു.

  • "ആവർത്തനം" എന്നത് "സംസാരശബ്ദം" എന്നതിന് പകരം "ഏജന്റിക്" എന്ന തോന്നൽ ഉണ്ടാക്കുന്ന ഭാഗമാണ്. ലാങ്‌ചെയിൻ "ഏജന്റുകൾ" ഡോക്സ്

ചില ഏജന്റുമാർ അടിസ്ഥാനപരമായി ബുദ്ധിമാനായ മാക്രോകളാണ്. മറ്റു ചിലർ ജോലികൾ നന്നായി ചെയ്യാനും പിശകുകളിൽ നിന്ന് കരകയറാനും കഴിയുന്ന ഒരു ജൂനിയർ ഓപ്പറേറ്ററെ പോലെയാണ് പ്രവർത്തിക്കുന്നത്. രണ്ടും പ്രധാനമാണ്.

കൂടാതെ, നിങ്ങൾക്ക് പൂർണ്ണ സ്വയംഭരണം ആവശ്യമില്ല. വാസ്തവത്തിൽ... നിങ്ങൾക്ക് അത് വേണ്ടായിരിക്കാം 🙃


2) നിങ്ങൾ ഒരു ഏജന്റിനെ എപ്പോൾ നിർമ്മിക്കണം (എപ്പോൾ ചെയ്യരുത്) 🚦

ഇനിപ്പറയുന്ന സാഹചര്യങ്ങളിൽ ഒരു ഏജന്റിനെ നിർമ്മിക്കുക:

  • ജോലി പല ഘട്ടങ്ങളിലായി , മധ്യത്തിൽ എന്ത് സംഭവിക്കുന്നു എന്നതിനെ ആശ്രയിച്ച് അത് മാറുന്നു.

  • ജോലിക്ക് ടൂൾ ഉപയോഗം (ഡാറ്റാബേസുകൾ, CRM-കൾ, കോഡ് എക്സിക്യൂഷൻ, ഫയൽ ജനറേഷൻ, ബ്രൗസറുകൾ, ഇന്റേണൽ API-കൾ). LangChain “ടൂൾസ്” ഡോക്സ്

  • ഒറ്റത്തവണയുള്ള ഉത്തരങ്ങളല്ല, ഗാർഡ്‌റെയിലുകൾ ഉപയോഗിച്ച് ആവർത്തിക്കാവുന്ന ഫലങ്ങൾ വേണം

  • ഒരു കമ്പ്യൂട്ടറിന് പരിശോധിക്കാൻ കഴിയുന്ന രീതിയിൽ, അയഞ്ഞ രീതിയിൽ പോലും, "പൂർത്തിയായി" എന്ന് നിങ്ങൾക്ക് നിർവചിക്കാം.

ഇനിപ്പറയുന്ന സാഹചര്യങ്ങളിൽ ഒരു ഏജന്റിനെ നിർമ്മിക്കരുത്:

  • ഒരു ലളിതമായ പ്രോംപ്റ്റ് + പ്രതികരണം അത് പരിഹരിക്കും (അമിതമായി എഞ്ചിനീയറിംഗ് ചെയ്യരുത്, പിന്നീട് നിങ്ങൾക്ക് സ്വയം വെറുപ്പ് തോന്നും).

  • നിങ്ങൾക്ക് തികഞ്ഞ നിശ്ചയദാർഢ്യം ആവശ്യമാണ് (ഏജന്റുകൾ സ്ഥിരതയുള്ളവരായിരിക്കാം, പക്ഷേ റോബോട്ടിക് ആയിരിക്കരുത്).

  • ബന്ധിപ്പിക്കാൻ നിങ്ങൾക്ക് ഉപകരണങ്ങളോ ഡാറ്റയോ ഇല്ല - പിന്നെ അത് മിക്കവാറും വൈബുകൾ മാത്രമാണ്.

തുറന്നു പറയാം: “AI ഏജന്റ് പ്രോജക്റ്റുകളിൽ” പകുതിയും കുറച്ച് ബ്രാഞ്ചിംഗ് നിയമങ്ങളുള്ള ഒരു വർക്ക്ഫ്ലോ ആയിരിക്കാം. പക്ഷേ, ചിലപ്പോൾ വൈബും പ്രധാനമാണ് 🤷♂️


3) ഒരു AI ഏജന്റിന്റെ നല്ല പതിപ്പ് എന്താണ് ✅

"എന്താണ് ഒരു നല്ല പതിപ്പ് ഉണ്ടാക്കുന്നത്" എന്ന വിഭാഗം നിങ്ങൾ ചോദിച്ചു, പക്ഷേ ഞാൻ അൽപ്പം വ്യക്തമായി പറയും:

ഒരു AI ഏജന്റിന്റെ നല്ല പതിപ്പ് ഒന്നല്ല . അത് ഇനിപ്പറയുന്നവയാണ്:

നിങ്ങളുടെ ഏജന്റിനെ പരീക്ഷിക്കാൻ കഴിയുന്നില്ലെങ്കിൽ, അത് അടിസ്ഥാനപരമായി വളരെ ആത്മവിശ്വാസമുള്ള ഒരു സ്ലോട്ട് മെഷീനാണ്. പാർട്ടികളിൽ രസകരമാണ്, നിർമ്മാണത്തിൽ ഭയപ്പെടുത്തുന്നതാണ് 😬


4) ഒരു ഏജന്റിന്റെ പ്രധാന നിർമാണ ബ്ലോക്കുകൾ (“അനാട്ടമി” 🧩)

മിക്ക ഖര ഏജന്റുമാർക്കും ഈ കഷണങ്ങൾ ഉണ്ട്:

എ) കൺട്രോളർ ലൂപ്പ് 🔁

ഇതാണ് ഓർക്കസ്ട്രേറ്റർ:

  • ലക്ഷ്യം നേടുക

  • അടുത്ത നടപടിക്കായി മോഡലിനോട് ചോദിക്കുക

  • റൺ ടൂൾ

  • നിരീക്ഷണം കൂട്ടിച്ചേർക്കുക

  • LangChain “ഏജന്റ്സ്” ഡോക്സ് പൂർത്തിയാകുന്നതുവരെ ആവർത്തിക്കുക.

ബി) ഉപകരണങ്ങൾ (കഴിവുകൾ എന്നും അറിയപ്പെടുന്നു) 🧰

ഒരു ഏജന്റിനെ ഫലപ്രദമാക്കുന്നത് ഉപകരണങ്ങളാണ്: ലാങ്‌ചെയിൻ “ടൂൾസ്” ഡോക്‌സ്

  • ഡാറ്റാബേസ് അന്വേഷണങ്ങൾ

  • ഇമെയിലുകൾ അയയ്ക്കുന്നു

  • ഫയലുകൾ വലിക്കുന്നു

  • റണ്ണിംഗ് കോഡ്

  • ആന്തരിക API-കൾ വിളിക്കുന്നു

  • സ്പ്രെഡ്ഷീറ്റുകളിലേക്കോ CRM-കളിലേക്കോ എഴുതുന്നു

സി) മെമ്മറി 🗃️

രണ്ട് തരം പ്രധാനമാണ്:

  • ഹ്രസ്വകാല മെമ്മറി : നിലവിലെ പ്രവർത്തന സന്ദർഭം, സമീപകാല ഘട്ടങ്ങൾ, നിലവിലെ പദ്ധതി

  • ദീർഘകാല മെമ്മറി : ഉപയോക്തൃ മുൻഗണനകൾ, പ്രോജക്റ്റ് സന്ദർഭം, വീണ്ടെടുത്ത അറിവ് (പലപ്പോഴും എംബെഡിംഗുകൾ + ഒരു വെക്റ്റർ സ്റ്റോർ വഴി) RAG പേപ്പർ

ഡി) ആസൂത്രണവും തീരുമാന നയവും 🧭

നിങ്ങൾ അതിനെ "ആസൂത്രണം" എന്ന് വിളിക്കുന്നില്ലെങ്കിലും, നിങ്ങൾക്ക് ഒരു രീതി ആവശ്യമാണ്:

ഇ) ഗാർഡ്‌റെയിലുകളും വിലയിരുത്തലും 🧯

അതെ, ഇത് പ്രോംപ്റ്റിംഗിനേക്കാൾ എഞ്ചിനീയറിംഗ് ആണ്. അതാണ്... ഒരുതരം കാര്യം.


5) താരതമ്യ പട്ടിക: ഒരു ഏജന്റിനെ നിർമ്മിക്കാനുള്ള ജനപ്രിയ വഴികൾ 🧾

താഴെ ഒരു യഥാർത്ഥ "താരതമ്യ പട്ടിക" ഉണ്ട് - ചില പ്രത്യേകതകളോടെ, കാരണം യഥാർത്ഥ ടീമുകൾ വിചിത്രമാണ് 😄

ഉപകരണം / ഫ്രെയിംവർക്ക് പ്രേക്ഷകർ വില എന്തുകൊണ്ട് ഇത് പ്രവർത്തിക്കുന്നു കുറിപ്പുകൾ (ചെറിയ കുഴപ്പങ്ങൾ)
ലാങ്‌ചെയിൻ ലെഗോ-സ്റ്റൈൽ ഘടകങ്ങൾ ഇഷ്ടപ്പെടുന്ന നിർമ്മാതാക്കൾ ഫ്രീ-ഇഷ് + ഇൻഫ്രാ ഉപകരണങ്ങൾ, മെമ്മറി, ശൃംഖലകൾ എന്നിവയ്‌ക്കായുള്ള വലിയ ആവാസവ്യവസ്ഥ പേരുകൾ വ്യക്തമായി പറഞ്ഞില്ലെങ്കിൽ സ്പാഗെട്ടി പെട്ടെന്ന് കിട്ടുമോ?
ലാമഇൻഡക്സ് RAG-ഹെവി ടീമുകൾ ഫ്രീ-ഇഷ് + ഇൻഫ്രാ ശക്തമായ വീണ്ടെടുക്കൽ പാറ്റേണുകൾ, സൂചികയിലാക്കൽ, കണക്ടറുകൾ നിങ്ങളുടെ ഏജന്റ് അടിസ്ഥാനപരമായി "സെർച്ച് + ആക്ട്" ആയിരിക്കുമ്പോൾ വളരെ നല്ലതാണ്... അത് സാധാരണമാണ്
ഓപ്പൺഎഐ അസിസ്റ്റന്റ്സ് സ്റ്റൈൽ സമീപനം വേഗത്തിലുള്ള സജ്ജീകരണം ആഗ്രഹിക്കുന്ന ടീമുകൾ ഉപയോഗാധിഷ്ഠിതം ബിൽറ്റ്-ഇൻ ടൂൾ കോളിംഗ് പാറ്റേണുകളും റൺ സ്റ്റേറ്റും ചില കോണുകളിൽ വഴക്കം കുറവാണ്, പക്ഷേ പല ആപ്ലിക്കേഷനുകൾക്കും ഇത് വൃത്തിയുള്ളതാണ് OpenAI API പ്രവർത്തിപ്പിക്കുന്നു OpenAI അസിസ്റ്റന്റ്സ് ഫംഗ്ഷൻ കോളിംഗ്
സെമാന്റിക് കേർണൽ ഘടനാപരമായ ഓർക്കസ്ട്രേഷൻ ആഗ്രഹിക്കുന്ന ഡെവലപ്പർമാർ സ്വതന്ത്രമായ കഴിവുകൾ/പ്രവർത്തനങ്ങൾക്കായുള്ള കൃത്യമായ സംഗ്രഹം "എന്റർപ്രൈസ് വൃത്തിയുള്ളതായി" തോന്നുന്നു - ചിലപ്പോൾ അതൊരു അഭിനന്ദനമാണ് 😉
ഓട്ടോജെൻ മൾട്ടി-ഏജന്റ് പരീക്ഷണാർത്ഥികൾ സ്വതന്ത്രമായ ഏജന്റ്-ടു-ഏജന്റ് സഹകരണ പാറ്റേണുകൾ അമിതമായി സംസാരിക്കാം; കർശനമായ പിരിച്ചുവിടൽ നിയമങ്ങൾ സ്ഥാപിക്കുക
ക്രൂഎഐ "ഏജന്റുമാരുടെ ടീമുകളുടെ" ആരാധകർ സ്വതന്ത്രമായ റോളുകൾ + ജോലികൾ + കൈമാറ്റങ്ങൾ എന്നിവ പ്രകടിപ്പിക്കാൻ എളുപ്പമാണ് ജോലികൾ മൃദുവാകാതെ, വ്യക്തമാകുമ്പോഴാണ് ഏറ്റവും നന്നായി പ്രവർത്തിക്കുന്നത്
ഹെയ്‌സ്റ്റാക്ക് തിരയൽ + പൈപ്പ്‌ലൈൻ ആളുകൾ സ്വതന്ത്രമായ സോളിഡ് പൈപ്പ്‌ലൈനുകൾ, വീണ്ടെടുക്കൽ, ഘടകങ്ങൾ കുറവ് “ഏജന്റ് തിയേറ്റർ”, കൂടുതൽ “പ്രായോഗിക ഫാക്ടറി”
സ്വന്തമായി റോൾ ചെയ്യുക (ഇഷ്ടാനുസൃത ലൂപ്പ്) ഫ്രീക്കുകളെ നിയന്ത്രിക്കുക (സ്നേഹമുള്ള) നിങ്ങളുടെ സമയം കുറഞ്ഞ മാജിക്, പരമാവധി വ്യക്തത സാധാരണയായി ഏറ്റവും മികച്ചത് ദീർഘകാലാടിസ്ഥാനത്തിൽ... എല്ലാം വീണ്ടും കണ്ടുപിടിക്കുന്നത് വരെ 😅

ഒരൊറ്റ വിജയിയും ഇല്ല. നിങ്ങളുടെ ഏജന്റിന്റെ പ്രധാന ജോലി വീണ്ടെടുക്കൽ , ടൂൾ എക്സിക്യൂഷൻ , മൾട്ടി-ഏജന്റ് ഏകോപനം അല്ലെങ്കിൽ വർക്ക്ഫ്ലോ ഓട്ടോമേഷൻ .


6) ഒരു AI ഏജന്റ് എങ്ങനെ ഘട്ടം ഘട്ടമായി നിർമ്മിക്കാം (യഥാർത്ഥ പാചകക്കുറിപ്പ്) 🍳🤖

ഇതാണ് മിക്ക ആളുകളും ഒഴിവാക്കുന്ന ഭാഗം, പിന്നെ ഏജന്റ് ഒരു പാന്ററിയിലെ ഒരു റാക്കൂണിനെപ്പോലെ പെരുമാറുന്നത് എന്തുകൊണ്ടാണെന്ന് അവർ ആശ്ചര്യപ്പെടുന്നു.

ഘട്ടം 1: ഒറ്റ വാചകത്തിൽ ജോലി നിർവചിക്കുക 🎯

ഉദാഹരണങ്ങൾ:

  • "നയവും ടിക്കറ്റിന്റെ സന്ദർഭവും ഉപയോഗിച്ച് ഒരു ഉപഭോക്തൃ മറുപടി തയ്യാറാക്കുക, തുടർന്ന് അംഗീകാരം ആവശ്യപ്പെടുക."

  • "ഒരു ബഗ് റിപ്പോർട്ട് അന്വേഷിക്കുക, അത് പുനർനിർമ്മിക്കുക, ഒരു പരിഹാരം നിർദ്ദേശിക്കുക."

  • "അപൂർണ്ണമായ മീറ്റിംഗ് കുറിപ്പുകളെ ടാസ്‌ക്കുകൾ, ഉടമകൾ, സമയപരിധികൾ എന്നിവയാക്കി മാറ്റുക."

നിങ്ങൾക്ക് ലളിതമായി നിർവചിക്കാൻ കഴിയുന്നില്ലെങ്കിൽ, നിങ്ങളുടെ ഏജന്റിനും കഴിയില്ല. ഞാൻ ഉദ്ദേശിക്കുന്നത് അതിന് കഴിയും എന്നാണ്, പക്ഷേ അത് മെച്ചപ്പെടുത്തും, കൂടാതെ മെച്ചപ്പെടുത്തൽ ബജറ്റുകൾ മരിക്കുന്നത് ഇംപ്രൊവൈസേഷനിലാണ്.

ഘട്ടം 2: സ്വയംഭരണ നില തീരുമാനിക്കുക (താഴ്ന്നത്, ഇടത്തരം, എരിവ്) 🌶️

  • കുറഞ്ഞ സ്വയംഭരണം : ഘട്ടങ്ങൾ നിർദ്ദേശിക്കുന്നു, മനുഷ്യ ക്ലിക്കുകൾ "അംഗീകരിക്കുന്നു"

  • മീഡിയം : ഉപകരണങ്ങൾ പ്രവർത്തിപ്പിക്കുന്നു, ഔട്ട്‌പുട്ട് ഡ്രാഫ്റ്റ് ചെയ്യുന്നു, അനിശ്ചിതത്വത്തിൽ വർദ്ധിക്കുന്നു.

  • ഉയർന്നത് : അവസാനം മുതൽ അവസാനം വരെ എക്സിക്യൂട്ട് ചെയ്യുന്നു, ഒഴിവാക്കലുകളിൽ മനുഷ്യരെ മാത്രം പിംഗ് ചെയ്യുന്നു.

നിങ്ങൾക്ക് വേണ്ടതിലും താഴ്ന്ന നിലയിൽ ആരംഭിക്കുക. പിന്നീട് എപ്പോൾ വേണമെങ്കിലും അത് വർദ്ധിപ്പിക്കാം.

ഘട്ടം 3: നിങ്ങളുടെ മോഡൽ തന്ത്രം തിരഞ്ഞെടുക്കുക 🧠

നിങ്ങൾ സാധാരണയായി തിരഞ്ഞെടുക്കുന്നത്:

  • എല്ലാത്തിനും ഒരു ശക്തമായ മാതൃക (ലളിതം)

  • വിലകുറഞ്ഞ ഘട്ടങ്ങൾക്ക് (വർഗ്ഗീകരണം, റൂട്ടിംഗ്) ഒരു ശക്തമായ മോഡൽ + ചെറിയ മോഡൽ

  • ആവശ്യമെങ്കിൽ പ്രത്യേക മാതൃകകൾ (ദർശനം, കോഡ്, സംസാരം)

ഇതും തീരുമാനിക്കുക:

  • പരമാവധി ടോക്കണുകൾ

  • താപനില

  • നിങ്ങൾ ആന്തരികമായി ദീർഘമായ യുക്തിപരമായ സൂചനകൾ അനുവദിക്കുമോ (നിങ്ങൾക്ക് കഴിയും, പക്ഷേ അന്തിമ ഉപയോക്താക്കൾക്ക് ചിന്താ ശൃംഖല തുറന്നുകാട്ടരുത്)

ഘട്ടം 4: കർശനമായ സ്കീമകൾ ഉപയോഗിച്ച് ഉപകരണങ്ങൾ നിർവചിക്കുക 🔩

ഉപകരണങ്ങൾ ഇതായിരിക്കണം:

do_anything(input: string) എന്ന ടൂളിന് പകരം , ഇത് നിർമ്മിക്കുക:

  • search_kb(ചോദ്യം: സ്ട്രിംഗ്) -> ഫലങ്ങൾ[]

  • create_ticket(ശീർഷകം: സ്ട്രിംഗ്, ബോഡി: സ്ട്രിംഗ്, മുൻഗണന: enum) -> ടിക്കറ്റ്_ഐഡി

  • send_email(to: string, subject: string, body: string) -> സ്റ്റാറ്റസ് OpenAI ഫംഗ്ഷൻ കോളിംഗ് ഗൈഡ്

നിങ്ങൾ ഏജന്റിന് ഒരു ചെയിൻസോ നൽകിയാൽ, അവർ വേലി കൂടി നീക്കം ചെയ്ത് ഒരു വേലി വെട്ടിമുറിക്കുമ്പോൾ ഞെട്ടരുത്.

ഘട്ടം 5: കൺട്രോളർ ലൂപ്പ് നിർമ്മിക്കുക 🔁

ഏറ്റവും കുറഞ്ഞ ലൂപ്പ്:

  1. ലക്ഷ്യം + പ്രാരംഭ സന്ദർഭം ഉപയോഗിച്ച് ആരംഭിക്കുക

  2. മോഡലിനോട് ചോദിക്കുക: "അടുത്ത നടപടി?"

  3. ടൂൾ കോൾ ചെയ്താൽ - ടൂൾ എക്സിക്യൂട്ട് ചെയ്യുക

  4. നിരീക്ഷണം കൂട്ടിച്ചേർക്കുക

  5. സ്റ്റോപ്പ് അവസ്ഥ പരിശോധിക്കുക

  6. (പരമാവധി ഘട്ടങ്ങളോടെ) LangChain "ഏജന്റുകൾ" ഡോക്സ്

ചേർക്കുക:

ഘട്ടം 6: മെമ്മറി ശ്രദ്ധാപൂർവ്വം ചേർക്കുക 🗃️

ഹ്രസ്വകാല: ഓരോ ഘട്ടത്തിലും ഒരു കോം‌പാക്റ്റ് "സ്റ്റേറ്റ് സംഗ്രഹം" അപ്‌ഡേറ്റ് ചെയ്യുക. ലാങ്‌ചെയിൻ "മെമ്മറി അവലോകനം"
ദീർഘകാലം: ഈടുനിൽക്കുന്ന വസ്തുതകൾ (ഉപയോക്തൃ മുൻഗണനകൾ, ഓർഗനൈസേഷൻ നിയമങ്ങൾ, സ്ഥിരതയുള്ള പ്രമാണങ്ങൾ) സംഭരിക്കുക.

പെരുമാറ്റച്ചട്ടം:

  • അത് ഇടയ്ക്കിടെ മാറുകയാണെങ്കിൽ - അത് ഹ്രസ്വകാലത്തേക്ക് നിലനിർത്തുക

  • അത് സ്ഥിരതയുള്ളതാണെങ്കിൽ - ദീർഘകാലത്തേക്ക് സൂക്ഷിക്കുക

  • സെൻസിറ്റീവ് ആണെങ്കിൽ - കുറഞ്ഞ അളവിൽ മാത്രം സംഭരിക്കുക (അല്ലെങ്കിൽ ഒട്ടും സൂക്ഷിക്കാതിരിക്കുക)

ഘട്ടം 7: സാധൂകരണവും ഒരു "വിമർശക" പാസും ചേർക്കുക 🧪

വിലകുറഞ്ഞതും പ്രായോഗികവുമായ ഒരു പാറ്റേൺ:

  • ഏജന്റ് ഫലം സൃഷ്ടിക്കുന്നു

  • വാലിഡേറ്റർ ഘടനയും നിയന്ത്രണങ്ങളും പരിശോധിക്കുന്നു

  • വിട്ടുപോയ ഘട്ടങ്ങൾക്കോ ​​നയ ലംഘനങ്ങൾക്കോ ​​ഉള്ള ഓപ്ഷണൽ ക്രിട്ടിക് മോഡൽ അവലോകനങ്ങൾ NIST AI RMF 1.0

പൂർണമല്ല, പക്ഷേ അതിൽ ഞെട്ടിപ്പിക്കുന്ന അളവിൽ അസംബന്ധങ്ങൾ കാണാം.

ഘട്ടം 8: ലോഗിൻ ചെയ്യാത്തതിൽ നിങ്ങൾ ഖേദിക്കുന്നതെല്ലാം ലോഗ് ചെയ്യുക 📜

ലോഗ്:

ഭാവി - നീ നന്ദി പറയും. വർത്തമാനം - നീ മറക്കും. അതാണ് ജീവിതം 😵💫


7) നിങ്ങളുടെ ആത്മാവിനെ തകർക്കാത്ത ടൂൾ കോളിംഗ് 🧰😵

"ഒരു AI ഏജന്റിനെ എങ്ങനെ നിർമ്മിക്കാം" എന്നത് യഥാർത്ഥ സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയറിംഗായി മാറുന്നിടത്താണ് ടൂൾ കോളിംഗ്.

ഉപകരണങ്ങൾ ആശ്രയിക്കാവുന്നതാക്കുക (ആശ്രയിക്കാവുന്നത് നല്ലതാണ്)

വിശ്വസനീയമായ ഉപകരണങ്ങൾ ഇവയാണ്:

ടൂൾ ലെയറിൽ പ്രോംപ്റ്റുകൾ മാത്രമല്ല, ഗാർഡ്‌റെയിലുകളും ചേർക്കുക

പ്രോംപ്റ്റുകൾ മാന്യമായ നിർദ്ദേശങ്ങളാണ്. ടൂൾ വാലിഡേഷൻ ഒരു പൂട്ടിയ വാതിലാണ്. OpenAI ഘടനാപരമായ ഔട്ട്‌പുട്ടുകൾ.

ചെയ്യുക:

  • അനുമതി പട്ടികകൾ (ഏതൊക്കെ ഉപകരണങ്ങൾ പ്രവർത്തിപ്പിക്കാൻ കഴിയും)

  • ഇൻപുട്ട് വാലിഡേഷൻ

  • നിരക്ക് പരിധികൾ OpenAI നിരക്ക് പരിധി ഗൈഡ്

  • ഓരോ ഉപയോക്താവിനും/org-നുമുള്ള അനുമതി പരിശോധനകൾ

  • അപകടകരമായ പ്രവർത്തനങ്ങൾക്ക് "ഡ്രൈ-റൺ മോഡ്"

ഭാഗിക പരാജയത്തിനുള്ള രൂപകൽപ്പന

ഉപകരണങ്ങൾ പരാജയപ്പെടുന്നു. നെറ്റ്‌വർക്കുകൾ ആടിയുലയുന്നു. ഓത്ത് കാലഹരണപ്പെടുന്നു. ഒരു ഏജന്റ് ഇനിപ്പറയുന്നവ ചെയ്യണം:

നിശബ്ദമായി ഫലപ്രദമായ ഒരു തന്ത്രം: ഘടനാപരമായ പിശകുകൾ തിരികെ നൽകുക:

  • തരം: auth_error

  • തരം: not_found

  • തരം: rate_limited
    അതിനാൽ മോഡലിന് പരിഭ്രാന്തരാകുന്നതിനുപകരം ബുദ്ധിപരമായി പ്രതികരിക്കാൻ കഴിയും.


8) നിങ്ങളെ വേട്ടയാടുന്നതിനു പകരം സഹായിക്കുന്ന ഓർമ്മ 👻🗂️

ഓർമ്മശക്തി ശക്തമാണ്, പക്ഷേ അത് ഒരു മാലിന്യ ഡ്രോയറായി മാറാനും സാധ്യതയുണ്ട്.

ഹ്രസ്വകാല മെമ്മറി: അത് ഒതുക്കമുള്ളതായി നിലനിർത്തുക

ഉപയോഗിക്കുക:

  • അവസാന N ഘട്ടങ്ങൾ

  • ഒരു റണ്ണിംഗ് സംഗ്രഹം (ഓരോ ലൂപ്പിലും അപ്ഡേറ്റ് ചെയ്തു)

  • നിലവിലെ പ്ലാൻ

  • നിലവിലെ പരിമിതികൾ (ബജറ്റ്, സമയം, നയങ്ങൾ)

എല്ലാം സന്ദർഭത്തിലേക്ക് ചുരുക്കിയാൽ, നിങ്ങൾക്ക് ലഭിക്കുന്നത്:

  • ഉയർന്ന വില

  • കുറഞ്ഞ ലേറ്റൻസി

  • കൂടുതൽ ആശയക്കുഴപ്പം (അതെ, അപ്പോഴും)

ദീർഘകാല ഓർമ്മ: "സ്റ്റഫിംഗിന്" ശേഷമുള്ള വീണ്ടെടുക്കൽ

മിക്ക "ദീർഘകാല മെമ്മറി"യും ഇതുപോലെയാണ്:

  • ഉൾച്ചേർക്കലുകൾ

  • വെക്റ്റർ സ്റ്റോർ

  • റിട്രീവൽ ഓഗ്മെന്റഡ് ജനറേഷൻ (RAG) RAG പേപ്പർ

ഏജന്റ് ഓർമ്മിക്കുന്നില്ല. റൺടൈമിൽ ഏറ്റവും പ്രസക്തമായ സ്‌നിപ്പെറ്റുകൾ ഇത് വീണ്ടെടുക്കുന്നു. ലാമഇൻഡെക്സ് “RAG-നുള്ള ആമുഖം”

പ്രായോഗിക ഓർമ്മ നിയമങ്ങൾ

  • "മുൻഗണനകൾ" വ്യക്തമായ വസ്തുതകളായി സംഭരിക്കുക: "ഉപയോക്താവിന് ബുള്ളറ്റ് സംഗ്രഹങ്ങൾ ഇഷ്ടമാണ്, ഇമോജികൾ വെറുക്കുന്നു" (lol, ഇവിടെ ഇല്ല 😄)

  • "തീരുമാനങ്ങൾ" ടൈംസ്റ്റാമ്പുകളോ പതിപ്പുകളോ ഉപയോഗിച്ച് സൂക്ഷിക്കുക (അല്ലെങ്കിൽ വൈരുദ്ധ്യങ്ങൾ കുന്നുകൂടും)

  • രഹസ്യങ്ങൾ സൂക്ഷിക്കേണ്ടത് അത്യാവശ്യമാണെങ്കിൽ പോലും ഒരിക്കലും സൂക്ഷിക്കരുത്

എന്റെ അപൂർണ്ണമായ രൂപകം ഇതാ: ഓർമ്മ ഒരു റഫ്രിജറേറ്റർ പോലെയാണ്. നിങ്ങൾ ഒരിക്കലും അത് വൃത്തിയാക്കിയില്ലെങ്കിൽ, ഒടുവിൽ നിങ്ങളുടെ സാൻഡ്‌വിച്ചിന് ഉള്ളിയുടെയും പശ്ചാത്താപത്തിന്റെയും രുചി ലഭിക്കും.


9) പ്ലാനിംഗ് പാറ്റേണുകൾ (ലളിതം മുതൽ ഫാൻസി വരെ) 🧭✨

ആസൂത്രണം എന്നത് നിയന്ത്രിതമായ വിഘടനം മാത്രമാണ്. അതിനെ നിഗൂഢമാക്കരുത്.

പാറ്റേൺ എ: ചെക്ക്‌ലിസ്റ്റ് പ്ലാനർ ✅

  • മോഡൽ ഘട്ടങ്ങളുടെ ഒരു ലിസ്റ്റ് ഔട്ട്പുട്ട് ചെയ്യുന്നു

  • ഘട്ടം ഘട്ടമായി നടപ്പിലാക്കുന്നു

  • ചെക്ക്‌ലിസ്റ്റ് നില അപ്‌ഡേറ്റ് ചെയ്യുന്നു

ഓൺബോർഡിംഗിന് മികച്ചത്. ലളിതം, പരീക്ഷിക്കാവുന്നത്.

പാറ്റേൺ ബി: റിയാക്ട് ലൂപ്പ് (കാരണം + പ്രവൃത്തി) 🧠→🧰

  • മോഡൽ അടുത്ത ടൂൾ കോൾ തീരുമാനിക്കുന്നു

  • ഔട്ട്പുട്ട് നിരീക്ഷിക്കുന്നു

  • റിയാക്ട് പേപ്പർ ആവർത്തിക്കുന്നു

ഇതാണ് ക്ലാസിക് ഏജന്റ് അനുഭവം.

പാറ്റേൺ സി: സൂപ്പർവൈസർ-തൊഴിലാളി 👥

ടാസ്‌ക്കുകൾ സമാന്തരമാക്കാൻ കഴിയുമ്പോഴോ, അല്ലെങ്കിൽ നിങ്ങൾക്ക് വ്യത്യസ്ത "റോളുകൾ" ആവശ്യമുള്ളപ്പോഴോ ഇത് വിലപ്പെട്ടതാണ്:

  • ഗവേഷകൻ

  • കോഡർ

  • എഡിറ്റർ

  • QA ചെക്കർ

പാറ്റേൺ ഡി: പ്ലാൻ-പിന്നീട്-എക്സിക്യൂട്ട് ഉപയോഗിച്ച് റീപ്ലാനിംഗ് 🔄

  • പ്ലാൻ സൃഷ്ടിക്കുക

  • നടപ്പിലാക്കുക

  • ഉപകരണ ഫലങ്ങൾ യാഥാർത്ഥ്യത്തെ മാറ്റുകയാണെങ്കിൽ, വീണ്ടും ആസൂത്രണം ചെയ്യുക

ഇത് ഏജന്റിനെ ഒരു മോശം പദ്ധതി പിന്തുടരുന്നതിൽ നിന്ന് തടയുന്നു. ക്ഷീണിതരല്ലെങ്കിൽ മനുഷ്യരും ഇത് ചെയ്യുന്നു, അങ്ങനെയാണെങ്കിൽ അവർ മോശം പദ്ധതികളും പിന്തുടരുന്നു.


10) സുരക്ഷ, വിശ്വാസ്യത, പിരിച്ചുവിടപ്പെടാതിരിക്കൽ 🔐😅

നിങ്ങളുടെ ഏജന്റിന് നടപടിയെടുക്കാൻ കഴിയുമെങ്കിൽ, നിങ്ങൾക്ക് സുരക്ഷാ രൂപകൽപ്പന ആവശ്യമാണ്. "ഉണ്ടായിരിക്കാൻ നല്ലതല്ല". ആവശ്യം. NIST AI RMF 1.0

കർശനമായ പരിധികൾ

  • ഓരോ ഓട്ടത്തിനും പരമാവധി ചുവടുകൾ

  • മിനിറ്റിൽ പരമാവധി ടൂൾ കോളുകൾ

  • ഒരു സെഷനു വേണ്ടി ചെലവഴിക്കാവുന്ന പരമാവധി തുക (ടോക്കൺ ബജറ്റ്)

  • അംഗീകാരത്തിന് പിന്നിലെ നിയന്ത്രിത ഉപകരണങ്ങൾ

ഡാറ്റ കൈകാര്യം ചെയ്യൽ

  • ലോഗിൻ ചെയ്യുന്നതിന് മുമ്പ് സെൻസിറ്റീവ് ഇൻപുട്ടുകൾ എഡിറ്റ് ചെയ്യുക

  • പ്രത്യേക പരിതസ്ഥിതികൾ (ഡെവലപ്മെന്റ് vs പ്രൊഡക്ഷൻ)

  • ഏറ്റവും കുറഞ്ഞ പ്രിവിലേജ് ടൂൾ അനുമതികൾ

പെരുമാറ്റ നിയന്ത്രണങ്ങൾ

  • ഏജന്റിനെ ആന്തരിക തെളിവുകളുടെ ഭാഗങ്ങൾ ഉദ്ധരിക്കാൻ നിർബന്ധിക്കുക (ബാഹ്യ ലിങ്കുകളല്ല, ആന്തരിക റഫറൻസുകൾ മാത്രം)

  • ആത്മവിശ്വാസം കുറവായിരിക്കുമ്പോൾ അനിശ്ചിതത്വ പതാകകൾ ആവശ്യമാണ്

  • ഇൻപുട്ടുകൾ അവ്യക്തമാണെങ്കിൽ "വ്യക്തമാക്കുന്ന ചോദ്യം ചോദിക്കുക" എന്ന് ആവശ്യപ്പെടുന്നു

വിശ്വസനീയനായ ഒരു ഏജന്റ് ഏറ്റവും ആത്മവിശ്വാസമുള്ള ആളല്ല. ഊഹിക്കുമ്പോൾ അറിയുന്ന ആളാണ്... അങ്ങനെ പറയുന്നത്.


11) പരിശോധനയും വിലയിരുത്തലും (എല്ലാവരും ഒഴിവാക്കുന്ന ഭാഗം) 🧪📏

അളക്കാൻ കഴിയാത്തത് മെച്ചപ്പെടുത്താൻ കഴിയില്ല. അതെ, ആ വരി അസംബന്ധമാണ്, പക്ഷേ അത് അരോചകമായി സത്യമാണ്.

ഒരു സാഹചര്യ സെറ്റ് നിർമ്മിക്കുക

30-100 ടെസ്റ്റ് കേസുകൾ സൃഷ്ടിക്കുക:

സ്കോർ ഫലങ്ങൾ

ഇതുപോലുള്ള മെട്രിക്കുകൾ ഉപയോഗിക്കുക:

  • ടാസ്‌ക് വിജയ നിരക്ക്

  • പൂർത്തീകരണ സമയം

  • ഉപകരണ പിശക് വീണ്ടെടുക്കൽ നിരക്ക്

  • ഭ്രമാത്മക നിരക്ക് (തെളിവുകളില്ലാത്ത അവകാശവാദങ്ങൾ)

  • മനുഷ്യ അംഗീകാര നിരക്ക് (സൂപ്പർവൈസുചെയ്‌ത മോഡിൽ ആണെങ്കിൽ)

പ്രോംപ്റ്റുകൾക്കും ഉപകരണങ്ങൾക്കുമുള്ള റിഗ്രഷൻ പരിശോധനകൾ

നിങ്ങൾ എപ്പോൾ വേണമെങ്കിലും മാറാം:

  • ടൂൾ സ്കീമ

  • സിസ്റ്റം നിർദ്ദേശങ്ങൾ

  • വീണ്ടെടുക്കൽ യുക്തി

  • മെമ്മറി ഫോർമാറ്റ്
    സ്യൂട്ട് വീണ്ടും പ്രവർത്തിപ്പിക്കുക.

ഏജന്റുമാർ സെൻസിറ്റീവ് മൃഗങ്ങളാണ്. വീട്ടുചെടികളെപ്പോലെ, പക്ഷേ വില കൂടുതലാണ്.


12) നിങ്ങളുടെ ബജറ്റ് ഉരുകാത്ത വിന്യാസ പാറ്റേണുകൾ 💸🔥

ഒരു സർവീസിൽ നിന്ന് ആരംഭിക്കുക

ചെലവ് നിയന്ത്രണങ്ങൾ നേരത്തെ ചേർക്കുക

  • കാഷിംഗ് വീണ്ടെടുക്കൽ ഫലങ്ങൾ

  • സംഗ്രഹങ്ങൾ ഉപയോഗിച്ച് സംഭാഷണ അവസ്ഥയെ ചുരുക്കുന്നു

  • റൂട്ടിംഗിനും എക്സ്ട്രാക്ഷനും ചെറിയ മോഡലുകൾ ഉപയോഗിക്കുന്നു

  • "ആഴത്തിലുള്ള ചിന്താ രീതി" ഏറ്റവും കഠിനമായ ഘട്ടങ്ങളിലേക്ക് പരിമിതപ്പെടുത്തുന്നു

പൊതുവായ വാസ്തുവിദ്യാ തിരഞ്ഞെടുപ്പ്

  • സ്റ്റേറ്റ്‌ലെസ് കൺട്രോളർ + എക്സ്റ്റേണൽ സ്റ്റേറ്റ് സ്റ്റോർ (DB/redis)

  • ടൂൾ കോളുകൾ സാധ്യമാകുന്നിടത്തെല്ലാം ഐഡംപോട്ടന്റ് ആണ് സ്ട്രൈപ്പ് “ഐഡംപോട്ടന്റ് അഭ്യർത്ഥനകൾ”

  • നീണ്ട ജോലികൾക്കായി ക്യൂവിൽ നിൽക്കുക (അതിനാൽ നിങ്ങൾക്ക് ഒരു വെബ് അഭ്യർത്ഥന എന്നെന്നേക്കുമായി തുറന്നിരിക്കാൻ കഴിയില്ല)

കൂടാതെ: ഒരു "കിൽ സ്വിച്ച്" നിർമ്മിക്കുക. നിങ്ങൾക്ക് അത് ശരിക്കും ആവശ്യമുള്ളത് വരെ അത് ആവശ്യമില്ല 😬


13) സമാപന കുറിപ്പുകൾ - ഒരു AI ഏജന്റിനെ എങ്ങനെ നിർമ്മിക്കാം എന്നതിനെക്കുറിച്ചുള്ള ഹ്രസ്വ പതിപ്പ് 🎁🤖

മറ്റൊന്നും ഓർമ്മയില്ലെങ്കിൽ, ഇത് ഓർമ്മിക്കുക:

ഒരു ഏജന്റ് മാന്ത്രികനല്ല. മൂല്യവത്താകാൻ പലപ്പോഴും നല്ല തീരുമാനങ്ങൾ എടുക്കുന്ന ഒരു സംവിധാനമാണിത്... നാശനഷ്ടങ്ങൾ വരുത്തുന്നതിന് മുമ്പ് പരാജയം സമ്മതിക്കുന്നു. ഒരു തരത്തിൽ നിശബ്ദമായി ആശ്വാസം നൽകുന്നു 😌

അതെ, നിങ്ങൾ എല്ലാം ശരിയായി നിർമ്മിച്ചാൽ, ഒരിക്കലും ഉറങ്ങാത്ത, ഇടയ്ക്കിടെ പരിഭ്രാന്തരാകുന്ന, പേപ്പർവർക്കുകൾ ഇഷ്ടപ്പെടുന്ന ഒരു ചെറിയ ഡിജിറ്റൽ ഇന്റേണിനെ നിയമിക്കുന്നത് പോലെയാണ് തോന്നുന്നത്. അതിനാൽ, അടിസ്ഥാനപരമായി ഒരു ഇന്റേൺ.


പതിവുചോദ്യങ്ങൾ

ലളിതമായി പറഞ്ഞാൽ ഒരു AI ഏജന്റ് എന്താണ്?

ഒരു AI ഏജന്റ് അടിസ്ഥാനപരമായി ആവർത്തിക്കുന്ന ഒരു ലൂപ്പാണ്: ഇൻപുട്ട് എടുക്കുക, അടുത്ത ഘട്ടം തീരുമാനിക്കുക, ഒരു ഉപകരണം ഉപയോഗിക്കുക, ഫലം വായിക്കുക, അത് പൂർത്തിയാകുന്നതുവരെ ആവർത്തിക്കുക. “ഏജൻറിക്” ഭാഗം ചാറ്റിംഗ് മാത്രമല്ല, അഭിനയത്തിലൂടെയും നിരീക്ഷണത്തിലൂടെയും വരുന്നു. പല ഏജന്റുമാരും ടൂൾ ആക്‌സസ് ഉള്ള സ്മാർട്ട് ഓട്ടോമേഷൻ മാത്രമാണ്, മറ്റുള്ളവർ പിശകുകളിൽ നിന്ന് കരകയറാൻ കഴിയുന്ന ഒരു ജൂനിയർ ഓപ്പറേറ്ററെ പോലെയാണ് പെരുമാറുന്നത്.

ഒരു പ്രോംപ്റ്റ് മാത്രം ഉപയോഗിക്കുന്നതിന് പകരം എപ്പോഴാണ് ഞാൻ ഒരു AI ഏജന്റ് നിർമ്മിക്കേണ്ടത്?

ജോലി മൾട്ടി-സ്റ്റെപ്പായിരിക്കുകയും, ഇന്റർമീഡിയറ്റ് ഫലങ്ങളെ അടിസ്ഥാനമാക്കിയുള്ള മാറ്റങ്ങൾ വരുത്തുകയും, വിശ്വസനീയമായ ഉപകരണ ഉപയോഗം (API-കൾ, ഡാറ്റാബേസുകൾ, ടിക്കറ്റിംഗ്, കോഡ് എക്സിക്യൂഷൻ) ആവശ്യമുള്ളപ്പോൾ ഒരു ഏജന്റിനെ നിർമ്മിക്കുക. ഗാർഡ്‌റെയിലുകളും "പൂർത്തിയായി" എന്ന് പരിശോധിക്കാനുള്ള ഒരു മാർഗവും ഉപയോഗിച്ച് നിങ്ങൾക്ക് ആവർത്തിക്കാവുന്ന ഫലങ്ങൾ ആവശ്യമുള്ളപ്പോൾ ഏജന്റുകൾ ഉപയോഗപ്രദമാണ്. ഒരു ലളിതമായ പ്രോംപ്റ്റ്-റെസ്‌പോൺസ് പ്രവർത്തിക്കുന്നുണ്ടെങ്കിൽ, ഒരു ഏജന്റ് സാധാരണയായി അനാവശ്യമായ ഓവർഹെഡും അധിക പരാജയ മോഡുകളും ആയിരിക്കും.

ലൂപ്പുകളിൽ കുടുങ്ങിപ്പോകാത്ത ഒരു AI ഏജന്റിനെ എങ്ങനെ നിർമ്മിക്കാം?

ഹാർഡ് സ്റ്റോപ്പ് കണ്ടീഷനുകൾ ഉപയോഗിക്കുക: പരമാവധി ഘട്ടങ്ങൾ, പരമാവധി ടൂൾ കോളുകൾ, ക്ലിയർ കംപ്ലീഷൻ ചെക്കുകൾ. ഘടനാപരമായ ടൂൾ സ്കീമകൾ, ടൈംഔട്ടുകൾ, എന്നെന്നേക്കുമായി വീണ്ടും ശ്രമിക്കാത്ത പുനഃശ്രമങ്ങൾ എന്നിവ ചേർക്കുക. തീരുമാനങ്ങളും ടൂൾ ഔട്ട്‌പുട്ടുകളും ലോഗ് ചെയ്യുക, അതുവഴി അത് എവിടെയാണ് പാളം തെറ്റുന്നതെന്ന് നിങ്ങൾക്ക് കാണാൻ കഴിയും. ഒരു സാധാരണ സുരക്ഷാ വാൽവ് എസ്കലേഷൻ ആണ്: ഏജന്റ് അനിശ്ചിതത്വത്തിലാണെങ്കിലോ പിശകുകൾ ആവർത്തിക്കുകയാണെങ്കിലോ, അത് മെച്ചപ്പെടുത്തുന്നതിനുപകരം സഹായം ചോദിക്കണം.

ഒരു AI ഏജന്റ് എങ്ങനെ നിർമ്മിക്കാം എന്നതിനുള്ള ഏറ്റവും കുറഞ്ഞ ആർക്കിടെക്ചർ എന്താണ്?

കുറഞ്ഞപക്ഷം, മോഡലിന് ഒരു ലക്ഷ്യവും സന്ദർഭവും നൽകുന്ന, അടുത്ത പ്രവർത്തനം ആവശ്യപ്പെടുന്ന, ആവശ്യപ്പെട്ടാൽ ഒരു ഉപകരണം നടപ്പിലാക്കുന്ന, നിരീക്ഷണം കൂട്ടിച്ചേർക്കുന്ന, ആവർത്തിക്കുന്ന ഒരു കൺട്രോളർ ലൂപ്പെങ്കിലും നിങ്ങൾക്ക് ആവശ്യമാണ്. കർശനമായ ഇൻപുട്ട്/ഔട്ട്‌പുട്ട് ആകൃതികളും "പൂർത്തിയായി" എന്ന പരിശോധനയും ഉള്ള ഉപകരണങ്ങളും നിങ്ങൾക്ക് ആവശ്യമാണ്. നിങ്ങൾ സംസ്ഥാനം വൃത്തിയായി സൂക്ഷിക്കുകയും ഘട്ട പരിധികൾ നടപ്പിലാക്കുകയും ചെയ്താൽ, നിങ്ങളുടെ സ്വന്തം കൈകൊണ്ട് റോൾ-യുവർ-ഓൺ ലൂപ്പ് പോലും നന്നായി പ്രവർത്തിക്കും.

നിർമ്മാണത്തിൽ വിശ്വസനീയമാകുന്നതിന് ടൂൾ കോളിംഗ് എങ്ങനെ രൂപകൽപ്പന ചെയ്യണം?

ഉപകരണങ്ങൾ ഇടുങ്ങിയതും, ടൈപ്പ് ചെയ്തതും, അനുമതിയുള്ളതും, സാധുതയുള്ളതുമായി സൂക്ഷിക്കുക - ഒരു പൊതുവായ “do_anything” ടൂൾ ഒഴിവാക്കുക. ഏജന്റിന് ഇൻപുട്ടുകൾ കൈകൊണ്ട് വേവ് ചെയ്യാൻ കഴിയാത്തവിധം കർശനമായ സ്കീമകൾ (സ്ട്രക്ചേർഡ് ഔട്ട്‌പുട്ടുകൾ/ഫംഗ്ഷൻ കോളിംഗ് പോലുള്ളവ) തിരഞ്ഞെടുക്കുക. ടൂൾ ലെയറിൽ വെയ്‌മെന്റ്‌ലിസ്റ്റുകൾ, റേറ്റ് പരിധികൾ, ഉപയോക്തൃ/ഓർഗ് അനുമതി പരിശോധനകൾ എന്നിവ ചേർക്കുക. സാധ്യമാകുമ്പോൾ വീണ്ടും പ്രവർത്തിപ്പിക്കാൻ സുരക്ഷിതമായി കഴിയുന്ന തരത്തിൽ ഐഡംപോട്ടൻസി പാറ്റേണുകൾ ഉപയോഗിച്ച് ഉപകരണങ്ങൾ രൂപകൽപ്പന ചെയ്യുക.

ഏജന്റിനെ കൂടുതൽ വഷളാക്കാതെ മെമ്മറി ചേർക്കാൻ ഏറ്റവും നല്ല മാർഗം ഏതാണ്?

മെമ്മറിയെ രണ്ട് ഭാഗങ്ങളായി പരിഗണിക്കുക: ഹ്രസ്വകാല റൺ സ്റ്റേറ്റ് (സമീപകാല ഘട്ടങ്ങൾ, നിലവിലെ പദ്ധതി, നിയന്ത്രണങ്ങൾ) ദീർഘകാല വീണ്ടെടുക്കൽ (മുൻഗണനകൾ, സ്ഥിരതയുള്ള നിയമങ്ങൾ, പ്രസക്തമായ രേഖകൾ). പൂർണ്ണ ട്രാൻസ്ക്രിപ്റ്റുകളല്ല, റണ്ണിംഗ് സംഗ്രഹങ്ങൾ ഉപയോഗിച്ച് ഹ്രസ്വകാല കോംപാക്റ്റ് നിലനിർത്തുക. ദീർഘകാല മെമ്മറിക്ക്, വീണ്ടെടുക്കൽ (എംബെഡിംഗുകൾ + വെക്റ്റർ സ്റ്റോർ/RAG പാറ്റേണുകൾ) സാധാരണയായി എല്ലാം സന്ദർഭത്തിലേക്ക് "സ്റ്റഫ്" ചെയ്യുന്നതിനും മോഡലിനെ ആശയക്കുഴപ്പത്തിലാക്കുന്നതിനും അപ്പുറത്തേക്ക് പോകുന്നു.

ഏത് പ്ലാനിംഗ് പാറ്റേണാണ് ഞാൻ ഉപയോഗിക്കേണ്ടത്: ചെക്ക്‌ലിസ്റ്റ്, റിയാക്ട്, അല്ലെങ്കിൽ സൂപ്പർവൈസർ-വർക്കർ?

ജോലികൾ പ്രവചനാതീതമായിരിക്കുകയും പരീക്ഷിക്കാൻ എളുപ്പമുള്ള എന്തെങ്കിലും നിങ്ങൾ ആഗ്രഹിക്കുകയും ചെയ്യുമ്പോൾ ഒരു ചെക്ക്‌ലിസ്റ്റ് പ്ലാനർ മികച്ചതാണ്. ടൂൾ ഫലങ്ങൾ നിങ്ങൾ അടുത്തതായി ചെയ്യുന്നതിനെ മാറ്റുമ്പോൾ റീആക്ട്-സ്റ്റൈൽ ലൂപ്പുകൾ തിളങ്ങുന്നു. ടാസ്‌ക്കുകൾ സമാന്തരമാക്കാനോ വ്യത്യസ്ത റോളുകളിൽ നിന്ന് (ഗവേഷകൻ, കോഡർ, ക്യുഎ) പ്രയോജനം നേടാനോ കഴിയുമ്പോൾ സൂപ്പർവൈസർ-വർക്കർ പാറ്റേണുകൾ (ഓട്ടോജെൻ-സ്റ്റൈൽ റോൾ സെപ്പറേഷൻ പോലുള്ളവ) സഹായിക്കുന്നു. വീണ്ടും ആസൂത്രണം ചെയ്തുകൊണ്ട് ആസൂത്രണം ചെയ്യുക, തുടർന്ന് നടപ്പിലാക്കുക എന്നത് ദുശ്ശാഠ്യമുള്ള മോശം പദ്ധതികൾ ഒഴിവാക്കുന്നതിനുള്ള ഒരു പ്രായോഗിക മധ്യനിരയാണ്.

ഒരു ഏജന്റിന് യഥാർത്ഥ നടപടികൾ സ്വീകരിക്കാൻ കഴിയുമെങ്കിൽ, ഞാൻ എങ്ങനെയാണ് അവരെ സുരക്ഷിതരാക്കുന്നത്?

അംഗീകാരത്തിനോ "ഡ്രൈ-റൺ" മോഡുകൾക്കോ ​​പിന്നിലുള്ള അപകടകരമായ ഉപകരണങ്ങൾ നിയന്ത്രിക്കുക, കുറഞ്ഞ പ്രിവിലേജ് അനുമതികൾ ഉപയോഗിക്കുക. ബജറ്റുകളും പരിധികളും ചേർക്കുക: പരമാവധി ഘട്ടങ്ങൾ, പരമാവധി ചെലവ്, മിനിറ്റിൽ ടൂൾ കോൾ പരിധികൾ. ലോഗിംഗ് ചെയ്യുന്നതിന് മുമ്പ് സെൻസിറ്റീവ് ഡാറ്റ എഡിറ്റ് ചെയ്യുക, ഉൽപ്പാദന പരിതസ്ഥിതികളിൽ നിന്ന് ഡെവലപ്‌മെന്റിനെ വേർതിരിക്കുക. തെളിവുകൾ മാറ്റിസ്ഥാപിക്കാൻ ആത്മവിശ്വാസത്തെ അനുവദിക്കുന്നതിന് പകരം, അനിശ്ചിതത്വ ഫ്ലാഗുകൾ അല്ലെങ്കിൽ ചോദ്യങ്ങൾ വ്യക്തമാക്കൽ ആവശ്യമാണ്.

കാലക്രമേണ മെച്ചപ്പെടുന്നതിനായി ഒരു AI ഏജന്റിനെ ഞാൻ എങ്ങനെ പരീക്ഷിക്കുകയും വിലയിരുത്തുകയും ചെയ്യും?

ഹാപ്പി പാത്ത്‌സ്, എഡ്ജ് കേസുകൾ, ടൂൾ പരാജയങ്ങൾ, അവ്യക്തമായ അഭ്യർത്ഥനകൾ, പ്രോംപ്റ്റ്-ഇഞ്ചക്ഷൻ ശ്രമങ്ങൾ (OWASP-ശൈലി) എന്നിവ ഉപയോഗിച്ച് ഒരു സിനാരിയോ സ്യൂട്ട് നിർമ്മിക്കുക. ടാസ്‌ക് വിജയം, പൂർത്തീകരണ സമയം, ടൂൾ പിശകുകളിൽ നിന്നുള്ള വീണ്ടെടുക്കൽ, തെളിവില്ലാതെ ക്ലെയിമുകൾ എന്നിവ പോലുള്ള ഫലങ്ങൾ സ്കോർ ചെയ്യുക. നിങ്ങൾ ടൂൾ സ്കീമകൾ, പ്രോംപ്റ്റുകൾ, വീണ്ടെടുക്കൽ അല്ലെങ്കിൽ മെമ്മറി ഫോർമാറ്റിംഗ് എന്നിവ മാറ്റുമ്പോഴെല്ലാം, സ്യൂട്ട് വീണ്ടും പ്രവർത്തിപ്പിക്കുക. നിങ്ങൾക്ക് ഇത് പരീക്ഷിക്കാൻ കഴിയുന്നില്ലെങ്കിൽ, നിങ്ങൾക്ക് അത് വിശ്വസനീയമായി ഷിപ്പ് ചെയ്യാൻ കഴിയില്ല.

കാലതാമസവും ചെലവും വർദ്ധിപ്പിക്കാതെ ഒരു ഏജന്റിനെ എങ്ങനെ വിന്യസിക്കാം?

ഒരു സാധാരണ പാറ്റേൺ ഒരു സ്റ്റേറ്റ്‌ലെസ് കൺട്രോളറാണ്, അതിൽ ഒരു ബാഹ്യ സ്റ്റേറ്റ് സ്റ്റോർ (DB/Redis), അതിനു പിന്നിൽ ടൂൾ സർവീസുകൾ, ശക്തമായ ലോഗിംഗ്/മോണിറ്ററിംഗ് (പലപ്പോഴും OpenTelemetry) എന്നിവ ഉൾപ്പെടുന്നു. വീണ്ടെടുക്കൽ കാഷിംഗ്, കോം‌പാക്റ്റ് സ്റ്റേറ്റ് സംഗ്രഹങ്ങൾ, റൂട്ടിംഗ്/എക്‌സ്‌ട്രാക്ഷനുള്ള ചെറിയ മോഡലുകൾ, ഏറ്റവും കഠിനമായ ഘട്ടങ്ങളിലേക്ക് "ആഴത്തിലുള്ള ചിന്ത" പരിമിതപ്പെടുത്തൽ എന്നിവ ഉപയോഗിച്ച് ചെലവുകൾ നിയന്ത്രിക്കുക. വെബ് അഭ്യർത്ഥനകൾ തുറന്നിടാതിരിക്കാൻ നീണ്ട ജോലികൾക്കായി ക്യൂകൾ ഉപയോഗിക്കുക. എല്ലായ്പ്പോഴും ഒരു കിൽ സ്വിച്ച് ഉൾപ്പെടുത്തുക.

അവലംബം

  1. നാഷണൽ ഇൻസ്റ്റിറ്റ്യൂട്ട് ഓഫ് സ്റ്റാൻഡേർഡ്സ് ആൻഡ് ടെക്നോളജി (NIST) - NIST AI RMF 1.0 (വിശ്വാസ്യതയും സുതാര്യതയും) - nvlpubs.nist.gov

  2. OpenAI - ഘടനാപരമായ ഔട്ട്‌പുട്ടുകൾ - platform.openai.com

  3. OpenAI - ഫംഗ്ഷൻ കോളിംഗ് ഗൈഡ് - platform.openai.com

  4. OpenAI - നിരക്ക് പരിധി ഗൈഡ് - platform.openai.com

  5. OpenAI - റൺസ് API - platform.openai.com

  6. OpenAI - അസിസ്റ്റന്റ്സ് ഫംഗ്ഷൻ കോളിംഗ് - platform.openai.com

  7. ലാങ്‌ചെയിൻ - ഏജന്റ്സ് ഡോക്‌സ് (ജാവാസ്ക്രിപ്റ്റ്) - docs.langchain.com

  8. ലാങ്‌ചെയിൻ - ഡോക്‌സ് ടൂളുകൾ (പൈത്തൺ) - docs.langchain.com

  9. ലാങ്‌ചെയിൻ - മെമ്മറി അവലോകനം - docs.langchain.com

  10. arXiv - പ്രതികരണ പേപ്പർ (കാരണം + പ്രവൃത്തി) - arxiv.org

  11. arXiv - RAG പേപ്പർ - arxiv.org

  12. ആമസോൺ വെബ് സർവീസസ് (AWS) ബിൽഡേഴ്‌സ് ലൈബ്രറി - ടൈംഔട്ടുകൾ, പുനഃശ്രമങ്ങൾ, വിറയലോടെയുള്ള ബാക്ക്ഓഫ് - aws.amazon.com

  13. ഓപ്പൺ ടെലിമെട്രി - ഒബ്സർവബിലിറ്റി പ്രൈമർ - opentelemetry.io

  14. സ്ട്രൈപ്പ് - ഐഡംപോട്ടന്റ് അഭ്യർത്ഥനകൾ - docs.stripe.com

  15. ഗൂഗിൾ ക്ലൗഡ് - വീണ്ടും ശ്രമിക്കൽ തന്ത്രം (ബാക്ക്ഓഫ് + ജിറ്റർ) - docs.cloud.google.com

  16. OWASP - ലാർജ് ലാംഗ്വേജ് മോഡൽ ആപ്ലിക്കേഷനുകൾക്കുള്ള ടോപ്പ് 10 - owasp.org

  17. OWASP - LLM01 പ്രോംപ്റ്റ് ഇഞ്ചക്ഷൻ - genai.owasp.org

  18. ലാമഇൻഡെക്സ് - RAG-യുടെ ആമുഖം - developers.llamaindex.ai

  19. മൈക്രോസോഫ്റ്റ് - സെമാന്റിക് കേർണൽ - learn.microsoft.com

  20. മൈക്രോസോഫ്റ്റ് ഓട്ടോജെൻ - മൾട്ടി-ഏജന്റ് ഫ്രെയിംവർക്ക് (ഡോക്യുമെന്റേഷൻ) - microsoft.github.io

  21. ക്രൂഎഐ - ഏജന്റ്സ് ആശയങ്ങൾ - docs.crewai.com

  22. ഹേസ്റ്റാക്ക് (ഡീപ്‌സെറ്റ്) - റിട്രീവേഴ്സ് ഡോക്യുമെന്റേഷൻ - docs.haystack.deepset.ai

ഔദ്യോഗിക AI അസിസ്റ്റന്റ് സ്റ്റോറിൽ ഏറ്റവും പുതിയ AI കണ്ടെത്തുക

ഞങ്ങളേക്കുറിച്ച്

ബ്ലോഗിലേക്ക് മടങ്ങുക