AI എങ്ങനെയാണ് അപാകതകൾ കണ്ടെത്തുന്നത്?

ഡാറ്റാ പ്രവർത്തനങ്ങളിലെ നിശബ്ദ നായകൻ അനോമലി ഡിറ്റക്ഷനാണ് - വസ്തുക്കൾക്ക് തീ പിടിക്കുന്നതിന് മുമ്പ് മന്ത്രിക്കുന്ന പുക അലാറം.

ലളിതമായി പറഞ്ഞാൽ: "സാധാരണ-ഇഷ്" എങ്ങനെയിരിക്കുമെന്ന് AI മനസ്സിലാക്കുന്നു, പുതിയ സംഭവങ്ങൾക്ക് ഒരു അനോമലി സ്കോർ, തുടർന്ന് ഒരു പരിധി. നിങ്ങളുടെ ഡാറ്റ സീസണൽ, കുഴപ്പം, ഡ്രിഫ്റ്റിംഗ്, ഇടയ്ക്കിടെ നിങ്ങളോട് കള്ളം പറയുമ്പോൾ നിങ്ങൾ "സാധാരണ-ഇഷ്" എന്ന് എങ്ങനെ നിർവചിക്കുന്നു എന്നതാണ് പിശാചിന്റെ ലക്ഷ്യം. [1]

ഇതിനു ശേഷം നിങ്ങൾക്ക് വായിക്കാൻ ഇഷ്ടപ്പെട്ടേക്കാവുന്ന ലേഖനങ്ങൾ:

🔗 AI സമൂഹത്തിന് ഹാനികരമാകുന്നത് എന്തുകൊണ്ട്?
വ്യാപകമായ AI ദത്തെടുക്കലിന്റെ ധാർമ്മികവും സാമ്പത്തികവും സാമൂഹികവുമായ അപകടസാധ്യതകൾ പരിശോധിക്കുന്നു.

🔗 AI സിസ്റ്റങ്ങൾ യഥാർത്ഥത്തിൽ എത്രമാത്രം വെള്ളം ഉപയോഗിക്കുന്നു
ഡാറ്റാ സെന്റർ കൂളിംഗ്, പരിശീലന ആവശ്യങ്ങൾ, പാരിസ്ഥിതിക ജല ആഘാതം എന്നിവ വിശദീകരിക്കുന്നു.

🔗 എന്താണ് ഒരു AI ഡാറ്റാസെറ്റ്, അത് എന്തുകൊണ്ട് പ്രാധാന്യമർഹിക്കുന്നു
ഡാറ്റാസെറ്റുകൾ, ലേബലിംഗ്, ഉറവിടങ്ങൾ, മോഡൽ പ്രകടനത്തിൽ അവയുടെ പങ്ക് എന്നിവ നിർവചിക്കുന്നു.

🔗 സങ്കീർണ്ണമായ ഡാറ്റയിൽ നിന്നുള്ള ട്രെൻഡുകൾ AI എങ്ങനെ പ്രവചിക്കുന്നു
പാറ്റേൺ തിരിച്ചറിയൽ, മെഷീൻ ലേണിംഗ് മോഡലുകൾ, യഥാർത്ഥ ലോക പ്രവചന ഉപയോഗങ്ങൾ എന്നിവ ഉൾക്കൊള്ളുന്നു.

"AI എങ്ങനെയാണ് അപാകതകൾ കണ്ടെത്തുന്നത്?"

ഒരു നല്ല ഉത്തരം അൽഗോരിതങ്ങൾ പട്ടികപ്പെടുത്തുന്നതിനപ്പുറം മറ്റൊന്നുമല്ല. യഥാർത്ഥവും അപൂർണ്ണവുമായ ഡാറ്റയിൽ പ്രയോഗിക്കുമ്പോൾ മെക്കാനിക്സും അവ എങ്ങനെയിരിക്കും എന്നതും അത് വിശദീകരിക്കണം. ഏറ്റവും മികച്ച വിശദീകരണങ്ങൾ :

അടിസ്ഥാന ഘടകങ്ങൾ കാണിക്കുക: സവിശേഷതകൾ, അടിസ്ഥാനരേഖകൾ, സ്കോറുകൾ, പരിധികൾ. [1]
പ്രായോഗിക കുടുംബങ്ങളെ താരതമ്യം ചെയ്യുക: ദൂരം, സാന്ദ്രത, ഒരു-വർഗ്ഗം, ഒറ്റപ്പെടൽ, സാധ്യത, പുനർനിർമ്മാണം. [1]
സമയ ശ്രേണിയിലെ ചില പ്രത്യേകതകൾ കൈകാര്യം ചെയ്യുക: "സാധാരണ" എന്നത് ദിവസത്തിലെ സമയം, ആഴ്ചയിലെ ദിവസം, റിലീസുകൾ, അവധി ദിവസങ്ങൾ എന്നിവയെ ആശ്രയിച്ചിരിക്കുന്നു. [1]
മൂല്യനിർണ്ണയത്തെ ഒരു യഥാർത്ഥ നിയന്ത്രണമായി കണക്കാക്കുക: തെറ്റായ മുന്നറിയിപ്പുകൾ ശല്യപ്പെടുത്തുക മാത്രമല്ല - അവ വിശ്വാസത്തെ തകർക്കുന്നു. [4]
വ്യാഖ്യാനക്ഷമത + മനുഷ്യന്റെ-ഇൻ-ദി-ലൂപ്പ് എന്നിവ ഉൾപ്പെടുത്തുക, കാരണം "ഇത് വിചിത്രമാണ്" എന്നത് ഒരു മൂലകാരണമല്ല. [5]

കോർ മെക്കാനിക്സ്: ബേസ്‌ലൈനുകൾ, സ്‌കോറുകൾ, പരിധികൾ 🧠

മിക്ക അനോമലി സിസ്റ്റങ്ങളും - ഇഷ്ടമുള്ളതോ അല്ലാത്തതോ - മൂന്ന് ചലിക്കുന്ന ഭാഗങ്ങളിലേക്ക് ചുരുക്കുന്നു:

1) പ്രാതിനിധ്യം (അതായത്: മോഡൽ എന്താണ് കാണുന്നത്)

റോ സിഗ്നലുകൾ വളരെ അപൂർവമായി മാത്രമേ പര്യാപ്തമാകൂ. നിങ്ങൾ സവിശേഷതകൾ (റോളിംഗ് സ്ഥിതിവിവരക്കണക്കുകൾ, അനുപാതങ്ങൾ, ലാഗുകൾ, സീസണൽ ഡെൽറ്റകൾ) എഞ്ചിനീയറിംഗ് ചെയ്യുകയോ അല്ലെങ്കിൽ പ്രാതിനിധ്യങ്ങൾ പഠിക്കുകയോ (എംബെഡിംഗുകൾ, സബ്‌സ്‌പെയ്‌സുകൾ, പുനർനിർമ്മാണങ്ങൾ) ചെയ്യുകയോ ചെയ്യാം. [1]

2) സ്കോറിംഗ് (അഥവാ: ഇത് എത്ര "വിചിത്രം" ആണ്?)

പൊതുവായ സ്കോറിംഗ് ആശയങ്ങളിൽ ഇവ ഉൾപ്പെടുന്നു:

ദൂരത്തെ അടിസ്ഥാനമാക്കിയുള്ളത്: അയൽക്കാരിൽ നിന്ന് അകലെ = സംശയാസ്പദം. [1]
സാന്ദ്രത അടിസ്ഥാനമാക്കിയുള്ളത്: കുറഞ്ഞ പ്രാദേശിക സാന്ദ്രത = സംശയാസ്പദം (LOF ആണ് ആദ്യത്തേത്). [1]
ഒരു-ക്ലാസ് അതിരുകൾ: "സാധാരണ" എന്ന് പഠിക്കുക, പുറത്തുള്ളവ ഫ്ലാഗ് ചെയ്യുക. [1]
പ്രോബബിലിസ്റ്റിക്: ഘടിപ്പിച്ച മോഡലിന് കീഴിൽ കുറഞ്ഞ സാധ്യത = സംശയാസ്പദം. [1]
പുനർനിർമ്മാണ പിശക്: സാധാരണ രീതിയിൽ പരിശീലനം ലഭിച്ച ഒരു മോഡലിന് അത് പുനർനിർമ്മിക്കാൻ കഴിയുന്നില്ലെങ്കിൽ, അത് മിക്കവാറും ഓഫായിരിക്കാം. [1]

3) പരിധി നിശ്ചയിക്കൽ (അതായത്: മണി അടിക്കുമ്പോൾ)

പരിധികൾ നിശ്ചയിക്കാം, ക്വാണ്ടൈൽ അടിസ്ഥാനമാക്കിയുള്ളതാകാം, ഓരോ സെഗ്‌മെന്റിനും അല്ലെങ്കിൽ ചെലവ്-സെൻസിറ്റീവ് ആകാം - എന്നാൽ അവ വൈബുകളല്ല, അലേർട്ട് ബജറ്റുകൾക്കും ഡൗൺസ്ട്രീം ചെലവുകൾക്കും അനുസൃതമായി കാലിബ്രേറ്റ് ചെയ്യണം. [4]

വളരെ പ്രായോഗികമായ ഒരു വിശദാംശം: സ്കൈകിറ്റ്-ലേണിന്റെ ഔട്ട്‌ലിയർ/നോവൽറ്റി ഡിറ്റക്ടറുകൾ റോ സ്കോറുകൾ വെളിപ്പെടുത്തുകയും പിന്നീട് സ്കോറുകളെ ഇൻലിയർ/ഔട്ട്‌ലിയർ തീരുമാനങ്ങളാക്കി മാറ്റുന്നതിന് ഒരു പരിധി (പലപ്പോഴും ഒരു മലിനീകരണ-ശൈലി അനുമാനം വഴി നിയന്ത്രിക്കപ്പെടുന്നു) പ്രയോഗിക്കുകയും ചെയ്യുന്നു. [2]

പിന്നീട് വേദന തടയുന്ന ദ്രുത നിർവചനങ്ങൾ 🧯

സൂക്ഷ്മമായ തെറ്റുകളിൽ നിന്ന് നിങ്ങളെ രക്ഷിക്കുന്ന രണ്ട് വ്യത്യാസങ്ങൾ:

ഔട്ട്‌ലിയർ ഡിറ്റക്ഷൻ: നിങ്ങളുടെ പരിശീലന ഡാറ്റയിൽ ഇതിനകം ഔട്ട്‌ലിയറുകൾ ഉൾപ്പെട്ടിരിക്കാം; എന്തായാലും അൽഗോരിതം "സാന്ദ്രമായ സാധാരണ മേഖല" മാതൃകയാക്കാൻ ശ്രമിക്കുന്നു.
പുതുമ കണ്ടെത്തൽ: പരിശീലന ഡാറ്റ വൃത്തിയുള്ളതായി കണക്കാക്കപ്പെടുന്നു; പുതിയ നിരീക്ഷണങ്ങൾ പഠിച്ച സാധാരണ പാറ്റേണുമായി യോജിക്കുന്നുണ്ടോ എന്ന് നിങ്ങൾ വിലയിരുത്തുകയാണ്. [2]

കൂടാതെ: പുതുമ കണ്ടെത്തൽ പലപ്പോഴും ഒരു-ക്ലാസ് വർഗ്ഗീകരണമായി രൂപപ്പെടുത്താറുണ്ട് - അസാധാരണമായ ഉദാഹരണങ്ങൾ വിരളമോ നിർവചിക്കപ്പെടാത്തതോ ആയതിനാൽ മോഡലിംഗ് സാധാരണമാണ്. [1]

നിങ്ങൾ യഥാർത്ഥത്തിൽ ഉപയോഗിക്കുന്ന മേൽനോട്ടമില്ലാത്ത വർക്ക്‌ഹോഴ്‌സുകൾ 🧰

ലേബലുകൾ കുറവായിരിക്കുമ്പോൾ (അടിസ്ഥാനപരമായി എപ്പോഴും അങ്ങനെയാണ്), യഥാർത്ഥ പൈപ്പ്‌ലൈനുകളിൽ ദൃശ്യമാകുന്ന ഉപകരണങ്ങൾ ഇവയാണ്:

ഐസൊലേഷൻ ഫോറസ്റ്റ്: പല ടാബുലാർ കേസുകളിലും ശക്തമായ ഒരു ഡിഫോൾട്ട്, പ്രായോഗികമായി വ്യാപകമായി ഉപയോഗിക്കപ്പെടുകയും സ്കൈകിറ്റ്-ലേണിൽ നടപ്പിലാക്കുകയും ചെയ്യുന്നു. [2]
വൺ-ക്ലാസ് എസ്‌വി‌എം: ഫലപ്രദമാകുമെങ്കിലും ട്യൂണിംഗിനും അനുമാനങ്ങൾക്കും ഇത് സെൻസിറ്റീവ് ആണ്; ഹൈപ്പർപാരാമീറ്റർ ട്യൂണിംഗിന്റെ ശ്രദ്ധാപൂർവ്വമായ ആവശ്യകതയെ സ്കൈകിറ്റ്-ലേൺ വ്യക്തമായി വിളിക്കുന്നു. [2]
ലോക്കൽ ഔട്ട്‌ലിയർ ഫാക്ടർ (LOF): ക്ലാസിക് സാന്ദ്രത അടിസ്ഥാനമാക്കിയുള്ള സ്കോറിംഗ്; "നോർമൽ" ഒരു നല്ല ബ്ലോബ് അല്ലാത്തപ്പോൾ മികച്ചതാണ്. [1]

ആഴ്ചതോറും വീണ്ടും കണ്ടെത്തുന്ന ഒരു പ്രായോഗിക ഗോച്ച ടീമുകൾ: പരിശീലന സെറ്റിൽ നിങ്ങൾ ഔട്ട്‌ലിയർ ഡിറ്റക്ഷൻ നടത്തുന്നുണ്ടോ എന്നതിനെ ആശ്രയിച്ച് LOF വ്യത്യസ്തമായി പെരുമാറുന്നു, പുതിയ ഡാറ്റയിലെ പുതുമ കണ്ടെത്തലും - അദൃശ്യമായ പോയിന്റുകൾ സുരക്ഷിതമായി സ്കോർ ചെയ്യുന്നതിന് scikit-learn ന് പുതുമ=True ആവശ്യമാണ്. [2]

ഡാറ്റ ഭ്രാന്തമാകുമ്പോഴും പ്രവർത്തിക്കുന്ന ഒരു ശക്തമായ അടിസ്ഥാനരേഖ 🪓

"ഞങ്ങളെ വിസ്മൃതിയിലേക്ക് തള്ളിവിടാത്ത എന്തെങ്കിലും ഞങ്ങൾക്ക് വേണം" എന്ന മനോഭാവത്തിലാണെങ്കിൽ, ശക്തമായ സ്ഥിതിവിവരക്കണക്കുകൾ വിലകുറഞ്ഞതായി കണക്കാക്കപ്പെടുന്നു.

എക്സ്ട്രീം മൂല്യങ്ങളോടുള്ള സംവേദനക്ഷമത കുറയ്ക്കുന്നതിന് പരിഷ്കരിച്ച z-സ്കോർ മീഡിയനും MAD (മീഡിയൻ കേവല വ്യതിയാനം) ഉം ഉപയോഗിക്കുന്നു. NIST യുടെ EDA ഹാൻഡ്ബുക്ക് പരിഷ്കരിച്ച z-സ്കോർ ഫോം രേഖപ്പെടുത്തുകയും 3.5 ന് മുകളിലുള്ള ഒരു കേവല മൂല്യത്തിൽ സാധാരണയായി ഉപയോഗിക്കുന്ന "പൊട്ടൻഷ്യൽ ഔട്ട്‌ലിയർ" റൂൾ ഓഫ് തമ്പ് രേഖപ്പെടുത്തുകയും ചെയ്യുന്നു . [ 3 ]

ഇത് എല്ലാ അപാകത പ്രശ്‌നങ്ങളും പരിഹരിക്കില്ല - പക്ഷേ ഇത് പലപ്പോഴും ശക്തമായ ഒരു പ്രതിരോധ നിരയാണ്, പ്രത്യേകിച്ച് ശബ്ദായമാനമായ മെട്രിക്സുകൾക്കും പ്രാരംഭ ഘട്ട നിരീക്ഷണത്തിനും. [3]

ടൈം സീരീസ് റിയാലിറ്റി: “സാധാരണ” എന്നത് എപ്പോൾ എന്നതിനെ ആശ്രയിച്ചിരിക്കുന്നു ⏱️📈

സമയ ശ്രേണിയിലെ അപാകതകൾ സങ്കീർണ്ണമാണ്, കാരണം സന്ദർഭമാണ് മുഴുവൻ കാര്യവും: ഉച്ചയ്ക്ക് ഒരു കുതിച്ചുചാട്ടം പ്രതീക്ഷിക്കാം; പുലർച്ചെ 3 മണിക്ക് അതേ കുതിച്ചുചാട്ടം എന്തോ തീപിടിക്കുന്നു എന്നതിന്റെ അർത്ഥമായിരിക്കാം. അതിനാൽ, പല പ്രായോഗിക സംവിധാനങ്ങളും സമയ അവബോധ സവിശേഷതകൾ (ലാഗുകൾ, സീസണൽ ഡെൽറ്റകൾ, റോളിംഗ് വിൻഡോകൾ) ഉപയോഗിച്ച് സാധാരണത്വത്തെ മാതൃകയാക്കുകയും പ്രതീക്ഷിക്കുന്ന പാറ്റേണുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ സ്കോർ വ്യതിയാനങ്ങൾ ഉണ്ടാക്കുകയും ചെയ്യുന്നു. [1]

നിങ്ങൾക്ക് ഒരു നിയമം ഓർമ്മയുണ്ടെങ്കിൽ: നിങ്ങളുടെ ട്രാഫിക്കിന്റെ പകുതി "അസാധാരണം" എന്ന് പ്രഖ്യാപിക്കുന്നതിന് മുമ്പ് നിങ്ങളുടെ അടിസ്ഥാനരേഖ (മണിക്കൂർ/ദിവസം/മേഖല/സേവന ശ്രേണി) വിഭജിക്കുക . [1]

വിലയിരുത്തൽ: അപൂർവ സംഭവ കെണി 🧪

അപാകത കണ്ടെത്തൽ പലപ്പോഴും "വൈക്കോൽ കൂനയിലെ സൂചി" പോലെയാണ്, ഇത് വിലയിരുത്തലിനെ വിചിത്രമാക്കുന്നു:

പോസിറ്റീവുകൾ അപൂർവമായിരിക്കുമ്പോൾ ROC കർവുകൾ വഞ്ചനാപരമായി മികച്ചതായി കാണപ്പെടും.
പോസിറ്റീവ് ക്ലാസിലെ പ്രകടനത്തിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നതിനാൽ, അസന്തുലിതമായ ക്രമീകരണങ്ങൾക്ക് കൃത്യത-വീണ്ടെടുക്കൽ കാഴ്ചകൾ പലപ്പോഴും കൂടുതൽ വിവരദായകമാണ്. [4]
പ്രവർത്തനപരമായി, നിങ്ങൾക്ക് ഒരു അലേർട്ട് ബജറ്റും ആവശ്യമാണ് : കോപം അവസാനിപ്പിക്കാതെ മനുഷ്യർക്ക് മണിക്കൂറിൽ എത്ര അലേർട്ടുകൾ പരീക്ഷിക്കാൻ കഴിയും? [4]

റോളിംഗ് വിൻഡോകളിലുടനീളം ബാക്ക്‌ടെസ്റ്റ് ചെയ്യുന്നത് ക്ലാസിക് പരാജയ മോഡ് മനസ്സിലാക്കാൻ നിങ്ങളെ സഹായിക്കുന്നു: “ഇത് മനോഹരമായി പ്രവർത്തിക്കുന്നു... കഴിഞ്ഞ മാസത്തെ വിതരണത്തിൽ.” [1]

വ്യാഖ്യാനക്ഷമതയും മൂലകാരണവും: നിങ്ങളുടെ ജോലി കാണിക്കുക 🪄

വിശദീകരണമില്ലാതെ മുന്നറിയിപ്പ് നൽകുന്നത് ഒരു നിഗൂഢ പോസ്റ്റ്കാർഡ് ലഭിക്കുന്നത് പോലെയാണ്. ഉപയോഗപ്രദമാണ്, പക്ഷേ നിരാശാജനകമാണ്.

അനോമലി സ്‌കോറിന് ഏറ്റവും കൂടുതൽ സംഭാവന നൽകിയ സവിശേഷതകൾ ചൂണ്ടിക്കാണിച്ചുകൊണ്ടോ "ഇത് സാധാരണമായി കാണപ്പെടാൻ എന്താണ് മാറ്റേണ്ടത്?" എന്ന ശൈലി വിശദീകരണങ്ങൾ നൽകിക്കൊണ്ടോ ഇന്റർപ്രെറ്റബിലിറ്റി ടൂളുകൾക്ക് സഹായിക്കാനാകും. ഇന്റർപ്രെറ്റബിൾ മെഷീൻ ലേണിംഗ് പുസ്തകം സാധാരണ രീതികളെക്കുറിച്ചും (SHAP-ശൈലി ആട്രിബ്യൂഷനുകൾ ഉൾപ്പെടെ) അവയുടെ പരിമിതികളെക്കുറിച്ചുമുള്ള ഉറച്ചതും നിർണായകവുമായ ഒരു വഴികാട്ടിയാണ്. [5]

ലക്ഷ്യം പങ്കാളികൾക്ക് ആശ്വാസം നൽകുക മാത്രമല്ല - വേഗത്തിലുള്ള പരിശോധനയും ആവർത്തിച്ചുള്ള സംഭവങ്ങളുടെ എണ്ണത്തിലുള്ള കുറവുമാണ്.

വിന്യാസം, ഡ്രിഫ്റ്റ്, ഫീഡ്‌ബാക്ക് ലൂപ്പുകൾ 🚀

മോഡലുകൾ സ്ലൈഡുകളിലാണ് ജീവിക്കുന്നത്. അവ പൈപ്പ്‌ലൈനുകളിലാണ് ജീവിക്കുന്നത്.

"ഉൽപ്പാദനത്തിലെ ആദ്യ മാസത്തെ" ഒരു സാധാരണ കഥ: ഡിറ്റക്ടർ കൂടുതലും ഡിപ്ലോയ്‌മെന്റുകൾ, ബാച്ച് ജോലികൾ, നഷ്ടപ്പെട്ട ഡാറ്റ എന്നിവ ഫ്ലാഗ് ചെയ്യുന്നു... ഇത് ഇപ്പോഴും ഉപയോഗപ്രദമാണ് , കാരണം ഇത് "ഡാറ്റ ഗുണനിലവാര സംഭവങ്ങളെ" "ബിസിനസ് അപാകതകളിൽ" നിന്ന് വേർതിരിക്കാൻ നിങ്ങളെ നിർബന്ധിക്കുന്നു.

പ്രായോഗികമായി:

സ്വഭാവം മാറുന്നതിനനുസരിച്ച് ഡ്രിഫ്റ്റ് നിരീക്ഷിക്കുകയും വീണ്ടും പരിശീലിപ്പിക്കുകയും/പുനഃക്രമീകരിക്കുകയും ചെയ്യുക. [1]
എന്തെങ്കിലും പേജ് ചെയ്തത് എന്തുകൊണ്ടാണെന്ന് നിങ്ങൾക്ക് പുനർനിർമ്മിക്കാൻ കഴിയുന്ന തരത്തിൽ ലോഗ് സ്കോർ ഇൻപുട്ടുകൾ + മോഡൽ പതിപ്പ് . [5]
കാലക്രമേണ പരിധികളും സെഗ്‌മെന്റുകളും ട്യൂൺ ചെയ്യുന്നതിന് മനുഷ്യ ഫീഡ്‌ബാക്ക് (ഉപയോഗപ്രദവും ശബ്ദായമാനവുമായ അലേർട്ടുകൾ) ക്യാപ്‌ചർ ചെയ്യുക . [4]

സുരക്ഷാ ആംഗിൾ: IDS ഉം ബിഹേവിയറൽ അനലിറ്റിക്സും 🛡️

സുരക്ഷാ ടീമുകൾ പലപ്പോഴും നിയമാധിഷ്ഠിത കണ്ടെത്തലുമായി അപാകത ആശയങ്ങൾ കൂട്ടിക്കലർത്തുന്നു: “സാധാരണ ഹോസ്റ്റ് പെരുമാറ്റം” എന്നതിനുള്ള അടിസ്ഥാനരേഖകൾ, കൂടാതെ അറിയപ്പെടുന്ന മോശം പാറ്റേണുകൾക്കുള്ള ഒപ്പുകളും നയങ്ങളും. നുഴഞ്ഞുകയറ്റം കണ്ടെത്തുന്നതിനും തടയുന്നതിനുമുള്ള സിസ്റ്റം പരിഗണനകൾക്കായി NIST യുടെ SP 800-94 (ഫൈനൽ) വ്യാപകമായി പരാമർശിക്കപ്പെടുന്ന ഒരു ഫ്രെയിമിംഗായി തുടരുന്നു; 2012 ലെ “റെവ. 1” എന്ന കരട് ഒരിക്കലും അന്തിമമായില്ലെന്നും പിന്നീട് അത് പിൻവലിച്ചുവെന്നും ഇത് സൂചിപ്പിക്കുന്നു. [3]

വിവർത്തനം: സഹായിക്കുന്നിടത്ത് ML ഉപയോഗിക്കുക, പക്ഷേ വിരസമായ നിയമങ്ങൾ തള്ളിക്കളയരുത് - അവ പ്രവർത്തിക്കുന്നതിനാൽ അവ വിരസമാണ്.

താരതമ്യ പട്ടിക: ജനപ്രിയ രീതികൾ ഒറ്റനോട്ടത്തിൽ 📊

ഉപകരണം / രീതി	ഏറ്റവും മികച്ചത്	ഇത് എന്തുകൊണ്ട് പ്രവർത്തിക്കുന്നു (പ്രായോഗികമായി)
ശക്തമായ / പരിഷ്കരിച്ച z-സ്കോറുകൾ	ലളിതമായ മെട്രിക്കുകൾ, ദ്രുത അടിസ്ഥാനങ്ങൾ	"ആവശ്യത്തിന് നല്ലത്" ആവശ്യമുള്ളപ്പോൾ ശക്തമായ ആദ്യ പാസ്, കുറഞ്ഞ തെറ്റായ മുന്നറിയിപ്പുകൾ. [3]
ഒറ്റപ്പെടൽ വനം	ടാബുലാർ, സമ്മിശ്ര സവിശേഷതകൾ	സ്ഥിരസ്ഥിതി നടപ്പിലാക്കലും പ്രായോഗികമായി വ്യാപകമായി ഉപയോഗിക്കപ്പെടുന്നതും. [2]
വൺ-ക്ലാസ് എസ്‌വി‌എം	ഒതുക്കമുള്ള "സാധാരണ" പ്രദേശങ്ങൾ	ബൗണ്ടറി അടിസ്ഥാനമാക്കിയുള്ള പുതുമ കണ്ടെത്തൽ; ട്യൂണിംഗ് വളരെ പ്രധാനമാണ്. [2]
ലോക്കൽ ഔട്ട്‌ലിയർ ഫാക്ടർ	മാനിഫോൾഡ്-ഇഷ് നോർമലുകൾ	സാന്ദ്രതയിലെ വ്യത്യാസം അയൽക്കാരുമായുള്ള താരതമ്യം പ്രാദേശിക വിചിത്രതകളെ പിടികൂടുന്നു. [1]
പുനർനിർമ്മാണ പിശക് (ഉദാ: ഓട്ടോഎൻകോഡർ-സ്റ്റൈൽ)	ഉയർന്ന അളവിലുള്ള പാറ്റേണുകൾ	സാധാരണ രീതിയിൽ പരിശീലിക്കുക; വലിയ പുനർനിർമ്മാണ പിശകുകൾ വ്യതിയാനങ്ങളെ സൂചിപ്പിക്കും. [1]

ചീറ്റ് കോഡ്: ശക്തമായ അടിസ്ഥാനരേഖകൾ + വിരസമായ ഒരു മേൽനോട്ടമില്ലാത്ത രീതി ഉപയോഗിച്ച് ആരംഭിക്കുക, തുടർന്ന് വാടക നൽകുന്നിടത്ത് മാത്രം സങ്കീർണ്ണത ചേർക്കുക.

ഒരു മിനി പ്ലേബുക്ക്: പൂജ്യം മുതൽ അലേർട്ടുകൾ വരെ 🧭

പ്രവർത്തനപരമായി "വിചിത്രം" എന്നത് നിർവചിക്കുക (ലേറ്റൻസി, തട്ടിപ്പ് അപകടസാധ്യത, സിപിയു ത്രാഷ്, ഇൻവെന്ററി അപകടസാധ്യത).
ഒരു അടിസ്ഥാന നിർണ്ണയത്തോടെ ആരംഭിക്കുക (ശക്തമായ സ്ഥിതിവിവരക്കണക്കുകൾ അല്ലെങ്കിൽ സെഗ്മെന്റഡ് ത്രെഷോൾഡുകൾ). [3]
ഫസ്റ്റ് പാസായി ഒരു മേൽനോട്ടമില്ലാത്ത മോഡൽ തിരഞ്ഞെടുക്കുക (ഐസൊലേഷൻ ഫോറസ്റ്റ് / LOF / വൺ-ക്ലാസ് SVM). [2]
പോസിറ്റീവുകൾ വിരളമാണെങ്കിൽ, ജാഗ്രതയുള്ള ബജറ്റ് ഉപയോഗിച്ച് പരിധികൾ സജ്ജമാക്കുക , പിആർ-സ്റ്റൈൽ ചിന്ത ഉപയോഗിച്ച് വിലയിരുത്തുക. [4]
ഓരോ അലേർട്ടും പുനർനിർമ്മിക്കാവുന്നതും ഡീബഗ് ചെയ്യാവുന്നതുമാക്കുന്നതിന് വിശദീകരണങ്ങൾ + ലോഗിംഗ് ചേർക്കുക . [5]
ബാക്ക്‌ടെസ്റ്റ്, ഷിപ്പ്, പഠിക്കുക, വീണ്ടും കാലിബ്രേറ്റ് ചെയ്യുക - ഡ്രിഫ്റ്റ് സാധാരണമാണ്. [1]

ഡക്റ്റ് ടേപ്പും പ്രതീക്ഷയും ഉപയോഗിച്ച് നിങ്ങളുടെ ടൈംസ്റ്റാമ്പുകൾ ഒരുമിച്ച് ഉറപ്പിച്ചിട്ടില്ലെന്ന് കരുതുക... ഒരു ആഴ്ചയ്ക്കുള്ളിൽ നിങ്ങൾക്ക് ഇത് തീർച്ചയായും ചെയ്യാൻ കഴിയും. 😅

അന്തിമ കുറിപ്പുകൾ - വളരെ ദൈർഘ്യമേറിയതാണ്, ഞാൻ അത് വായിച്ചില്ല🧾

"സാധാരണ"ത്തിന്റെ പ്രായോഗിക ചിത്രം പഠിച്ചുകൊണ്ടും, വ്യതിയാനങ്ങൾ സ്കോർ ചെയ്തുകൊണ്ടും, ഒരു പരിധി കടക്കുന്നത് ഫ്ലാഗ് ചെയ്തുകൊണ്ടും AI അപാകതകൾ കണ്ടെത്തുന്നു. മികച്ച സിസ്റ്റങ്ങൾ വിജയിക്കുന്നത് മിന്നുന്ന രീതിയിലല്ല, മറിച്ച് കാലിബ്രേറ്റ് ചെയ്ത: സെഗ്മെന്റഡ് ബേസ്‌ലൈനുകൾ, അലേർട്ട് ബജറ്റുകൾ, വ്യാഖ്യാനിക്കാവുന്ന ഔട്ട്‌പുട്ടുകൾ, ശബ്ദായമാനമായ അലാറങ്ങളെ വിശ്വസനീയമായ സിഗ്നലാക്കി മാറ്റുന്ന ഒരു ഫീഡ്‌ബാക്ക് ലൂപ്പ്. [1]

അവലംബം

പിമെന്റൽ തുടങ്ങിയവർ (2014) - പുതുമ കണ്ടെത്തലിന്റെ ഒരു അവലോകനം (PDF, ഓക്സ്ഫോർഡ് സർവകലാശാല) കൂടുതൽ വായിക്കുക
സ്കൈകിറ്റ്-ലേൺ ഡോക്യുമെന്റേഷൻ - പുതുമയും ഔട്ട്‌ലിയർ ഡിറ്റക്ഷനും കൂടുതൽ വായിക്കുക
NIST/SEMATECH ഇ-ഹാൻഡ്‌ബുക്ക് - ഔട്ട്‌ലൈയറുകളുടെ കണ്ടെത്തൽ കൂടുതൽ വായിക്കുക , NIST CSRC - SP 800-94 (ഫൈനൽ): ഇൻട്രൂഷൻ ഡിറ്റക്ഷൻ ആൻഡ് പ്രിവൻഷൻ സിസ്റ്റങ്ങൾ (IDPS) ഗൈഡ് കൂടുതൽ വായിക്കുക
സൈറ്റോ & റെഹ്ംസ്മിയർ (2015) - ഇംബാലൻസ്ഡ് ഡാറ്റാസെറ്റുകളിൽ ബൈനറി ക്ലാസിഫയറുകൾ വിലയിരുത്തുമ്പോൾ (PLOS ONE) കൂടുതൽ വായിക്കുക
മോൾനാർ - ഇന്റർപ്രെറ്റബിൾ മെഷീൻ ലേണിംഗ് (വെബ് ബുക്ക്) കൂടുതൽ വായിക്കുക

ഔദ്യോഗിക AI അസിസ്റ്റന്റ് സ്റ്റോറിൽ ഏറ്റവും പുതിയ AI കണ്ടെത്തുക

ഞങ്ങളേക്കുറിച്ച്

ബ്ലോഗിലേക്ക് മടങ്ങുക