ഡാറ്റാ പ്രവർത്തനങ്ങളിലെ നിശബ്ദ നായകൻ അനോമലി ഡിറ്റക്ഷനാണ് - വസ്തുക്കൾക്ക് തീ പിടിക്കുന്നതിന് മുമ്പ് മന്ത്രിക്കുന്ന പുക അലാറം.
ലളിതമായി പറഞ്ഞാൽ: "സാധാരണ-ഇഷ്" എങ്ങനെയിരിക്കുമെന്ന് AI മനസ്സിലാക്കുന്നു, പുതിയ സംഭവങ്ങൾക്ക് ഒരു അനോമലി സ്കോർ , തുടർന്ന് ഒരു പരിധി . നിങ്ങളുടെ ഡാറ്റ സീസണൽ, കുഴപ്പം, ഡ്രിഫ്റ്റിംഗ്, ഇടയ്ക്കിടെ നിങ്ങളോട് കള്ളം പറയുമ്പോൾ നിങ്ങൾ "സാധാരണ-ഇഷ്" എന്ന് എങ്ങനെ നിർവചിക്കുന്നു എന്നതാണ് പിശാചിന്റെ ലക്ഷ്യം. [1]
ഇതിനു ശേഷം നിങ്ങൾക്ക് വായിക്കാൻ ഇഷ്ടപ്പെട്ടേക്കാവുന്ന ലേഖനങ്ങൾ:
🔗 AI സമൂഹത്തിന് ഹാനികരമാകുന്നത് എന്തുകൊണ്ട്?
വ്യാപകമായ AI ദത്തെടുക്കലിന്റെ ധാർമ്മികവും സാമ്പത്തികവും സാമൂഹികവുമായ അപകടസാധ്യതകൾ പരിശോധിക്കുന്നു.
🔗 AI സിസ്റ്റങ്ങൾ യഥാർത്ഥത്തിൽ എത്രമാത്രം വെള്ളം ഉപയോഗിക്കുന്നു
ഡാറ്റാ സെന്റർ കൂളിംഗ്, പരിശീലന ആവശ്യങ്ങൾ, പാരിസ്ഥിതിക ജല ആഘാതം എന്നിവ വിശദീകരിക്കുന്നു.
🔗 എന്താണ് ഒരു AI ഡാറ്റാസെറ്റ്, അത് എന്തുകൊണ്ട് പ്രാധാന്യമർഹിക്കുന്നു
ഡാറ്റാസെറ്റുകൾ, ലേബലിംഗ്, ഉറവിടങ്ങൾ, മോഡൽ പ്രകടനത്തിൽ അവയുടെ പങ്ക് എന്നിവ നിർവചിക്കുന്നു.
🔗 സങ്കീർണ്ണമായ ഡാറ്റയിൽ നിന്നുള്ള ട്രെൻഡുകൾ AI എങ്ങനെ പ്രവചിക്കുന്നു
പാറ്റേൺ തിരിച്ചറിയൽ, മെഷീൻ ലേണിംഗ് മോഡലുകൾ, യഥാർത്ഥ ലോക പ്രവചന ഉപയോഗങ്ങൾ എന്നിവ ഉൾക്കൊള്ളുന്നു.
"AI എങ്ങനെയാണ് അപാകതകൾ കണ്ടെത്തുന്നത്?"
ഒരു നല്ല ഉത്തരം അൽഗോരിതങ്ങൾ പട്ടികപ്പെടുത്തുന്നതിനപ്പുറം മറ്റൊന്നുമല്ല. യഥാർത്ഥവും അപൂർണ്ണവുമായ ഡാറ്റയിൽ പ്രയോഗിക്കുമ്പോൾ മെക്കാനിക്സും അവ എങ്ങനെയിരിക്കും എന്നതും അത് വിശദീകരിക്കണം. ഏറ്റവും മികച്ച വിശദീകരണങ്ങൾ :
-
അടിസ്ഥാന ഘടകങ്ങൾ കാണിക്കുക: സവിശേഷതകൾ , അടിസ്ഥാനരേഖകൾ , സ്കോറുകൾ , പരിധികൾ . [1]
-
പ്രായോഗിക കുടുംബങ്ങളെ താരതമ്യം ചെയ്യുക: ദൂരം, സാന്ദ്രത, ഒരു-വർഗ്ഗം, ഒറ്റപ്പെടൽ, സാധ്യത, പുനർനിർമ്മാണം. [1]
-
സമയ ശ്രേണിയിലെ ചില പ്രത്യേകതകൾ കൈകാര്യം ചെയ്യുക: "സാധാരണ" എന്നത് ദിവസത്തിലെ സമയം, ആഴ്ചയിലെ ദിവസം, റിലീസുകൾ, അവധി ദിവസങ്ങൾ എന്നിവയെ ആശ്രയിച്ചിരിക്കുന്നു. [1]
-
മൂല്യനിർണ്ണയത്തെ ഒരു യഥാർത്ഥ നിയന്ത്രണമായി കണക്കാക്കുക: തെറ്റായ മുന്നറിയിപ്പുകൾ ശല്യപ്പെടുത്തുക മാത്രമല്ല - അവ വിശ്വാസത്തെ തകർക്കുന്നു. [4]
-
വ്യാഖ്യാനക്ഷമത + മനുഷ്യന്റെ-ഇൻ-ദി-ലൂപ്പ് എന്നിവ ഉൾപ്പെടുത്തുക, കാരണം "ഇത് വിചിത്രമാണ്" എന്നത് ഒരു മൂലകാരണമല്ല. [5]
കോർ മെക്കാനിക്സ്: ബേസ്ലൈനുകൾ, സ്കോറുകൾ, പരിധികൾ 🧠
മിക്ക അനോമലി സിസ്റ്റങ്ങളും - ഇഷ്ടമുള്ളതോ അല്ലാത്തതോ - മൂന്ന് ചലിക്കുന്ന ഭാഗങ്ങളിലേക്ക് ചുരുക്കുന്നു:
1) പ്രാതിനിധ്യം (അതായത്: മോഡൽ എന്താണ് കാണുന്നത് )
റോ സിഗ്നലുകൾ വളരെ അപൂർവമായി മാത്രമേ പര്യാപ്തമാകൂ. നിങ്ങൾ സവിശേഷതകൾ (റോളിംഗ് സ്ഥിതിവിവരക്കണക്കുകൾ, അനുപാതങ്ങൾ, ലാഗുകൾ, സീസണൽ ഡെൽറ്റകൾ) എഞ്ചിനീയറിംഗ് ചെയ്യുകയോ അല്ലെങ്കിൽ പ്രാതിനിധ്യങ്ങൾ പഠിക്കുകയോ (എംബെഡിംഗുകൾ, സബ്സ്പെയ്സുകൾ, പുനർനിർമ്മാണങ്ങൾ) ചെയ്യുകയോ ചെയ്യാം. [1]
2) സ്കോറിംഗ് (അഥവാ: ഇത് എത്ര "വിചിത്രം" ആണ്?)
പൊതുവായ സ്കോറിംഗ് ആശയങ്ങളിൽ ഇവ ഉൾപ്പെടുന്നു:
-
ദൂരത്തെ അടിസ്ഥാനമാക്കിയുള്ളത് : അയൽക്കാരിൽ നിന്ന് അകലെ = സംശയാസ്പദം. [1]
-
സാന്ദ്രത അടിസ്ഥാനമാക്കിയുള്ളത് : കുറഞ്ഞ പ്രാദേശിക സാന്ദ്രത = സംശയാസ്പദം (LOF ആണ് ആദ്യത്തേത്). [1]
-
ഒരു-ക്ലാസ് അതിരുകൾ : "സാധാരണ" എന്ന് പഠിക്കുക, പുറത്തുള്ളവ ഫ്ലാഗ് ചെയ്യുക. [1]
-
പ്രോബബിലിസ്റ്റിക് : ഘടിപ്പിച്ച മോഡലിന് കീഴിൽ കുറഞ്ഞ സാധ്യത = സംശയാസ്പദം. [1]
-
പുനർനിർമ്മാണ പിശക് : സാധാരണ രീതിയിൽ പരിശീലനം ലഭിച്ച ഒരു മോഡലിന് അത് പുനർനിർമ്മിക്കാൻ കഴിയുന്നില്ലെങ്കിൽ, അത് മിക്കവാറും ഓഫായിരിക്കാം. [1]
3) പരിധി നിശ്ചയിക്കൽ (അതായത്: മണി അടിക്കുമ്പോൾ)
പരിധികൾ നിശ്ചയിക്കാം, ക്വാണ്ടൈൽ അടിസ്ഥാനമാക്കിയുള്ളതാകാം, ഓരോ സെഗ്മെന്റിനും അല്ലെങ്കിൽ ചെലവ്-സെൻസിറ്റീവ് ആകാം - എന്നാൽ അവ വൈബുകളല്ല, അലേർട്ട് ബജറ്റുകൾക്കും ഡൗൺസ്ട്രീം ചെലവുകൾക്കും അനുസൃതമായി കാലിബ്രേറ്റ്
വളരെ പ്രായോഗികമായ ഒരു വിശദാംശം: സ്കൈകിറ്റ്-ലേണിന്റെ ഔട്ട്ലിയർ/നോവൽറ്റി ഡിറ്റക്ടറുകൾ റോ സ്കോറുകൾ പിന്നീട് സ്കോറുകളെ ഇൻലിയർ/ഔട്ട്ലിയർ തീരുമാനങ്ങളാക്കി മാറ്റുന്നതിന് പരിധി
പിന്നീട് വേദന തടയുന്ന ദ്രുത നിർവചനങ്ങൾ 🧯
സൂക്ഷ്മമായ തെറ്റുകളിൽ നിന്ന് നിങ്ങളെ രക്ഷിക്കുന്ന രണ്ട് വ്യത്യാസങ്ങൾ:
-
ഔട്ട്ലിയർ ഡിറ്റക്ഷൻ : നിങ്ങളുടെ പരിശീലന ഡാറ്റയിൽ ഇതിനകം ഔട്ട്ലിയറുകൾ ഉൾപ്പെട്ടിരിക്കാം; എന്തായാലും അൽഗോരിതം "സാന്ദ്രമായ സാധാരണ മേഖല" മാതൃകയാക്കാൻ ശ്രമിക്കുന്നു.
-
പുതുമ കണ്ടെത്തൽ : പരിശീലന ഡാറ്റ വൃത്തിയുള്ളതായി കണക്കാക്കപ്പെടുന്നു; പുതിയ നിരീക്ഷണങ്ങൾ പഠിച്ച സാധാരണ പാറ്റേണുമായി യോജിക്കുന്നുണ്ടോ എന്ന് നിങ്ങൾ വിലയിരുത്തുകയാണ്. [2]
ഒരു-ക്ലാസ് വർഗ്ഗീകരണമായി രൂപപ്പെടുത്താറുണ്ട് - അസാധാരണമായ ഉദാഹരണങ്ങൾ വിരളമോ നിർവചിക്കപ്പെടാത്തതോ ആയതിനാൽ മോഡലിംഗ് സാധാരണമാണ്. [1]

നിങ്ങൾ യഥാർത്ഥത്തിൽ ഉപയോഗിക്കുന്ന മേൽനോട്ടമില്ലാത്ത വർക്ക്ഹോഴ്സുകൾ 🧰
ലേബലുകൾ കുറവായിരിക്കുമ്പോൾ (അടിസ്ഥാനപരമായി എപ്പോഴും അങ്ങനെയാണ്), യഥാർത്ഥ പൈപ്പ്ലൈനുകളിൽ ദൃശ്യമാകുന്ന ഉപകരണങ്ങൾ ഇവയാണ്:
-
ഐസൊലേഷൻ ഫോറസ്റ്റ് : പല ടാബുലാർ കേസുകളിലും ശക്തമായ ഒരു ഡിഫോൾട്ട്, പ്രായോഗികമായി വ്യാപകമായി ഉപയോഗിക്കപ്പെടുകയും സ്കൈകിറ്റ്-ലേണിൽ നടപ്പിലാക്കുകയും ചെയ്യുന്നു. [2]
-
വൺ-ക്ലാസ് എസ്വിഎം : ഫലപ്രദമാകുമെങ്കിലും ട്യൂണിംഗിനും അനുമാനങ്ങൾക്കും ഇത് സെൻസിറ്റീവ് ആണ്; ഹൈപ്പർപാരാമീറ്റർ ട്യൂണിംഗിന്റെ ശ്രദ്ധാപൂർവ്വമായ ആവശ്യകതയെ സ്കൈകിറ്റ്-ലേൺ വ്യക്തമായി വിളിക്കുന്നു. [2]
-
ലോക്കൽ ഔട്ട്ലിയർ ഫാക്ടർ (LOF) : ക്ലാസിക് സാന്ദ്രത അടിസ്ഥാനമാക്കിയുള്ള സ്കോറിംഗ്; "നോർമൽ" ഒരു നല്ല ബ്ലോബ് അല്ലാത്തപ്പോൾ മികച്ചതാണ്. [1]
ആഴ്ചതോറും വീണ്ടും കണ്ടെത്തുന്ന ഒരു പ്രായോഗിക ഗോച്ച ടീമുകൾ: പരിശീലന സെറ്റിൽ നിങ്ങൾ ഔട്ട്ലിയർ ഡിറ്റക്ഷൻ നടത്തുന്നുണ്ടോ എന്നതിനെ ആശ്രയിച്ച് LOF വ്യത്യസ്തമായി പെരുമാറുന്നു, പുതിയ ഡാറ്റയിലെ പുതുമ കണ്ടെത്തലും - അദൃശ്യമായ പോയിന്റുകൾ സുരക്ഷിതമായി സ്കോർ ചെയ്യുന്നതിന് പുതുമ=True
ഡാറ്റ ഭ്രാന്തമാകുമ്പോഴും പ്രവർത്തിക്കുന്ന ഒരു ശക്തമായ അടിസ്ഥാനരേഖ 🪓
"ഞങ്ങളെ വിസ്മൃതിയിലേക്ക് തള്ളിവിടാത്ത എന്തെങ്കിലും ഞങ്ങൾക്ക് വേണം" എന്ന മനോഭാവത്തിലാണെങ്കിൽ, ശക്തമായ സ്ഥിതിവിവരക്കണക്കുകൾ വിലകുറഞ്ഞതായി കണക്കാക്കപ്പെടുന്നു.
എക്സ്ട്രീം മൂല്യങ്ങളോടുള്ള സംവേദനക്ഷമത കുറയ്ക്കുന്നതിന് പരിഷ്കരിച്ച z-സ്കോർ മീഡിയനും MAD (മീഡിയൻ കേവല വ്യതിയാനം) ഉം ഉപയോഗിക്കുന്നു. NIST യുടെ EDA ഹാൻഡ്ബുക്ക് പരിഷ്കരിച്ച z-സ്കോർ ഫോം രേഖപ്പെടുത്തുകയും 3.5 ന് മുകളിലുള്ള ഒരു കേവല മൂല്യത്തിൽ സാധാരണയായി ഉപയോഗിക്കുന്ന "പൊട്ടൻഷ്യൽ ഔട്ട്ലിയർ" റൂൾ ഓഫ് തമ്പ് രേഖപ്പെടുത്തുകയും ചെയ്യുന്നു . [ 3 ]
ഇത് എല്ലാ അപാകത പ്രശ്നങ്ങളും പരിഹരിക്കില്ല - പക്ഷേ ഇത് പലപ്പോഴും ശക്തമായ ഒരു പ്രതിരോധ നിരയാണ്, പ്രത്യേകിച്ച് ശബ്ദായമാനമായ മെട്രിക്സുകൾക്കും പ്രാരംഭ ഘട്ട നിരീക്ഷണത്തിനും. [3]
ടൈം സീരീസ് റിയാലിറ്റി: “സാധാരണ” എന്നത് എപ്പോൾ എന്നതിനെ ആശ്രയിച്ചിരിക്കുന്നു ⏱️📈
സമയ ശ്രേണിയിലെ അപാകതകൾ സങ്കീർണ്ണമാണ്, കാരണം സന്ദർഭമാണ് മുഴുവൻ കാര്യവും: ഉച്ചയ്ക്ക് ഒരു കുതിച്ചുചാട്ടം പ്രതീക്ഷിക്കാം; പുലർച്ചെ 3 മണിക്ക് അതേ കുതിച്ചുചാട്ടം എന്തോ തീപിടിക്കുന്നു എന്നതിന്റെ അർത്ഥമായിരിക്കാം. അതിനാൽ, പല പ്രായോഗിക സംവിധാനങ്ങളും സമയ അവബോധ സവിശേഷതകൾ (ലാഗുകൾ, സീസണൽ ഡെൽറ്റകൾ, റോളിംഗ് വിൻഡോകൾ) ഉപയോഗിച്ച് സാധാരണത്വത്തെ മാതൃകയാക്കുകയും പ്രതീക്ഷിക്കുന്ന പാറ്റേണുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ സ്കോർ വ്യതിയാനങ്ങൾ ഉണ്ടാക്കുകയും ചെയ്യുന്നു. [1]
നിങ്ങൾക്ക് ഒരു നിയമം ഓർമ്മയുണ്ടെങ്കിൽ: നിങ്ങളുടെ ട്രാഫിക്കിന്റെ പകുതി "അസാധാരണം" എന്ന് പ്രഖ്യാപിക്കുന്നതിന് മുമ്പ് നിങ്ങളുടെ അടിസ്ഥാനരേഖ (മണിക്കൂർ/ദിവസം/മേഖല/സേവന ശ്രേണി) വിഭജിക്കുക
വിലയിരുത്തൽ: അപൂർവ സംഭവ കെണി 🧪
അപാകത കണ്ടെത്തൽ പലപ്പോഴും "വൈക്കോൽ കൂനയിലെ സൂചി" പോലെയാണ്, ഇത് വിലയിരുത്തലിനെ വിചിത്രമാക്കുന്നു:
-
പോസിറ്റീവുകൾ അപൂർവമായിരിക്കുമ്പോൾ ROC കർവുകൾ വഞ്ചനാപരമായി മികച്ചതായി കാണപ്പെടും.
-
പോസിറ്റീവ് ക്ലാസിലെ പ്രകടനത്തിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നതിനാൽ, അസന്തുലിതമായ ക്രമീകരണങ്ങൾക്ക് കൃത്യത-വീണ്ടെടുക്കൽ കാഴ്ചകൾ പലപ്പോഴും കൂടുതൽ വിവരദായകമാണ്. [4]
-
അലേർട്ട് ബജറ്റും ആവശ്യമാണ് : കോപം അവസാനിപ്പിക്കാതെ മനുഷ്യർക്ക് മണിക്കൂറിൽ എത്ര അലേർട്ടുകൾ പരീക്ഷിക്കാൻ കഴിയും? [4]
റോളിംഗ് വിൻഡോകളിലുടനീളം ബാക്ക്ടെസ്റ്റ് ചെയ്യുന്നത് ക്ലാസിക് പരാജയ മോഡ് മനസ്സിലാക്കാൻ നിങ്ങളെ സഹായിക്കുന്നു: “ഇത് മനോഹരമായി പ്രവർത്തിക്കുന്നു... കഴിഞ്ഞ മാസത്തെ വിതരണത്തിൽ.” [1]
വ്യാഖ്യാനക്ഷമതയും മൂലകാരണവും: നിങ്ങളുടെ ജോലി കാണിക്കുക 🪄
വിശദീകരണമില്ലാതെ മുന്നറിയിപ്പ് നൽകുന്നത് ഒരു നിഗൂഢ പോസ്റ്റ്കാർഡ് ലഭിക്കുന്നത് പോലെയാണ്. ഉപയോഗപ്രദമാണ്, പക്ഷേ നിരാശാജനകമാണ്.
ഏറ്റവും കൂടുതൽ സംഭാവന നൽകിയ സവിശേഷതകൾ ചൂണ്ടിക്കാണിച്ചുകൊണ്ടോ "ഇത് സാധാരണമായി കാണപ്പെടാൻ എന്താണ് മാറ്റേണ്ടത്?" എന്ന ശൈലി വിശദീകരണങ്ങൾ നൽകിക്കൊണ്ടോ ഇന്റർപ്രെറ്റബിലിറ്റി ടൂളുകൾക്ക് സഹായിക്കാനാകും. ഇന്റർപ്രെറ്റബിൾ മെഷീൻ ലേണിംഗ് പുസ്തകം സാധാരണ രീതികളെക്കുറിച്ചും (SHAP-ശൈലി ആട്രിബ്യൂഷനുകൾ ഉൾപ്പെടെ) അവയുടെ പരിമിതികളെക്കുറിച്ചുമുള്ള ഉറച്ചതും നിർണായകവുമായ ഒരു വഴികാട്ടിയാണ്. [5]
ലക്ഷ്യം പങ്കാളികൾക്ക് ആശ്വാസം നൽകുക മാത്രമല്ല - വേഗത്തിലുള്ള പരിശോധനയും ആവർത്തിച്ചുള്ള സംഭവങ്ങളുടെ എണ്ണത്തിലുള്ള കുറവുമാണ്.
വിന്യാസം, ഡ്രിഫ്റ്റ്, ഫീഡ്ബാക്ക് ലൂപ്പുകൾ 🚀
മോഡലുകൾ സ്ലൈഡുകളിലാണ് ജീവിക്കുന്നത്. അവ പൈപ്പ്ലൈനുകളിലാണ് ജീവിക്കുന്നത്.
"ഉൽപ്പാദനത്തിലെ ആദ്യ മാസത്തെ" ഒരു സാധാരണ കഥ: ഡിറ്റക്ടർ കൂടുതലും ഡിപ്ലോയ്മെന്റുകൾ, ബാച്ച് ജോലികൾ, നഷ്ടപ്പെട്ട ഡാറ്റ എന്നിവ ഫ്ലാഗ് ചെയ്യുന്നു... ഇത് ഇപ്പോഴും ഉപയോഗപ്രദമാണ് , കാരണം ഇത് "ഡാറ്റ ഗുണനിലവാര സംഭവങ്ങളെ" "ബിസിനസ് അപാകതകളിൽ" നിന്ന് വേർതിരിക്കാൻ നിങ്ങളെ നിർബന്ധിക്കുന്നു.
പ്രായോഗികമായി:
-
സ്വഭാവം മാറുന്നതിനനുസരിച്ച് ഡ്രിഫ്റ്റ് നിരീക്ഷിക്കുകയും
-
എന്തെങ്കിലും പേജ് ചെയ്തത് എന്തുകൊണ്ടാണെന്ന് നിങ്ങൾക്ക് പുനർനിർമ്മിക്കാൻ കഴിയുന്ന തരത്തിൽ ലോഗ് സ്കോർ ഇൻപുട്ടുകൾ + മോഡൽ പതിപ്പ്
-
കാലക്രമേണ പരിധികളും സെഗ്മെന്റുകളും ട്യൂൺ ചെയ്യുന്നതിന് മനുഷ്യ ഫീഡ്ബാക്ക് (ഉപയോഗപ്രദവും ശബ്ദായമാനവുമായ അലേർട്ടുകൾ) ക്യാപ്ചർ ചെയ്യുക
സുരക്ഷാ ആംഗിൾ: IDS ഉം ബിഹേവിയറൽ അനലിറ്റിക്സും 🛡️
സുരക്ഷാ ടീമുകൾ പലപ്പോഴും നിയമാധിഷ്ഠിത കണ്ടെത്തലുമായി അപാകത ആശയങ്ങൾ കൂട്ടിക്കലർത്തുന്നു: “സാധാരണ ഹോസ്റ്റ് പെരുമാറ്റം” എന്നതിനുള്ള അടിസ്ഥാനരേഖകൾ, കൂടാതെ അറിയപ്പെടുന്ന മോശം പാറ്റേണുകൾക്കുള്ള ഒപ്പുകളും നയങ്ങളും. നുഴഞ്ഞുകയറ്റം കണ്ടെത്തുന്നതിനും തടയുന്നതിനുമുള്ള സിസ്റ്റം പരിഗണനകൾക്കായി NIST യുടെ SP 800-94 (ഫൈനൽ) വ്യാപകമായി പരാമർശിക്കപ്പെടുന്ന ഒരു ഫ്രെയിമിംഗായി തുടരുന്നു; 2012 ലെ “റെവ. 1” എന്ന കരട് ഒരിക്കലും അന്തിമമായില്ലെന്നും പിന്നീട് അത് പിൻവലിച്ചുവെന്നും ഇത് സൂചിപ്പിക്കുന്നു. [3]
വിവർത്തനം: സഹായിക്കുന്നിടത്ത് ML ഉപയോഗിക്കുക, പക്ഷേ വിരസമായ നിയമങ്ങൾ തള്ളിക്കളയരുത് - അവ പ്രവർത്തിക്കുന്നതിനാൽ അവ വിരസമാണ്.
താരതമ്യ പട്ടിക: ജനപ്രിയ രീതികൾ ഒറ്റനോട്ടത്തിൽ 📊
| ഉപകരണം / രീതി | ഏറ്റവും മികച്ചത് | ഇത് എന്തുകൊണ്ട് പ്രവർത്തിക്കുന്നു (പ്രായോഗികമായി) |
|---|---|---|
| ശക്തമായ / പരിഷ്കരിച്ച z-സ്കോറുകൾ | ലളിതമായ മെട്രിക്കുകൾ, ദ്രുത അടിസ്ഥാനങ്ങൾ | "ആവശ്യത്തിന് നല്ലത്" ആവശ്യമുള്ളപ്പോൾ ശക്തമായ ആദ്യ പാസ്, കുറഞ്ഞ തെറ്റായ മുന്നറിയിപ്പുകൾ. [3] |
| ഒറ്റപ്പെടൽ വനം | ടാബുലാർ, സമ്മിശ്ര സവിശേഷതകൾ | സ്ഥിരസ്ഥിതി നടപ്പിലാക്കലും പ്രായോഗികമായി വ്യാപകമായി ഉപയോഗിക്കപ്പെടുന്നതും. [2] |
| വൺ-ക്ലാസ് എസ്വിഎം | ഒതുക്കമുള്ള "സാധാരണ" പ്രദേശങ്ങൾ | ബൗണ്ടറി അടിസ്ഥാനമാക്കിയുള്ള പുതുമ കണ്ടെത്തൽ; ട്യൂണിംഗ് വളരെ പ്രധാനമാണ്. [2] |
| ലോക്കൽ ഔട്ട്ലിയർ ഫാക്ടർ | മാനിഫോൾഡ്-ഇഷ് നോർമലുകൾ | സാന്ദ്രതയിലെ വ്യത്യാസം അയൽക്കാരുമായുള്ള താരതമ്യം പ്രാദേശിക വിചിത്രതകളെ പിടികൂടുന്നു. [1] |
| പുനർനിർമ്മാണ പിശക് (ഉദാ: ഓട്ടോഎൻകോഡർ-സ്റ്റൈൽ) | ഉയർന്ന അളവിലുള്ള പാറ്റേണുകൾ | സാധാരണ രീതിയിൽ പരിശീലിക്കുക; വലിയ പുനർനിർമ്മാണ പിശകുകൾ വ്യതിയാനങ്ങളെ സൂചിപ്പിക്കും. [1] |
ചീറ്റ് കോഡ്: ശക്തമായ അടിസ്ഥാനരേഖകൾ + വിരസമായ ഒരു മേൽനോട്ടമില്ലാത്ത രീതി ഉപയോഗിച്ച് ആരംഭിക്കുക, തുടർന്ന് വാടക നൽകുന്നിടത്ത് മാത്രം സങ്കീർണ്ണത ചേർക്കുക.
ഒരു മിനി പ്ലേബുക്ക്: പൂജ്യം മുതൽ അലേർട്ടുകൾ വരെ 🧭
-
പ്രവർത്തനപരമായി "വിചിത്രം" എന്നത് നിർവചിക്കുക (ലേറ്റൻസി, തട്ടിപ്പ് അപകടസാധ്യത, സിപിയു ത്രാഷ്, ഇൻവെന്ററി അപകടസാധ്യത).
-
ഒരു അടിസ്ഥാന നിർണ്ണയത്തോടെ ആരംഭിക്കുക (ശക്തമായ സ്ഥിതിവിവരക്കണക്കുകൾ അല്ലെങ്കിൽ സെഗ്മെന്റഡ് ത്രെഷോൾഡുകൾ). [3]
-
ഫസ്റ്റ് പാസായി ഒരു മേൽനോട്ടമില്ലാത്ത മോഡൽ തിരഞ്ഞെടുക്കുക
-
പോസിറ്റീവുകൾ വിരളമാണെങ്കിൽ, ജാഗ്രതയുള്ള ബജറ്റ് ഉപയോഗിച്ച് പരിധികൾ സജ്ജമാക്കുക
-
ഓരോ അലേർട്ടും പുനർനിർമ്മിക്കാവുന്നതും ഡീബഗ് ചെയ്യാവുന്നതുമാക്കുന്നതിന് വിശദീകരണങ്ങൾ + ലോഗിംഗ് ചേർക്കുക
-
ബാക്ക്ടെസ്റ്റ്, ഷിപ്പ്, പഠിക്കുക, വീണ്ടും കാലിബ്രേറ്റ് ചെയ്യുക - ഡ്രിഫ്റ്റ് സാധാരണമാണ്. [1]
ഡക്റ്റ് ടേപ്പും പ്രതീക്ഷയും ഉപയോഗിച്ച് നിങ്ങളുടെ ടൈംസ്റ്റാമ്പുകൾ ഒരുമിച്ച് ഉറപ്പിച്ചിട്ടില്ലെന്ന് കരുതുക... ഒരു ആഴ്ചയ്ക്കുള്ളിൽ നിങ്ങൾക്ക് ഇത് തീർച്ചയായും ചെയ്യാൻ കഴിയും. 😅
അന്തിമ കുറിപ്പുകൾ - വളരെ ദൈർഘ്യമേറിയതാണ്, ഞാൻ അത് വായിച്ചില്ല🧾
"സാധാരണ"ത്തിന്റെ പ്രായോഗിക ചിത്രം പഠിച്ചുകൊണ്ടും, വ്യതിയാനങ്ങൾ സ്കോർ ചെയ്തുകൊണ്ടും, ഒരു പരിധി കടക്കുന്നത് ഫ്ലാഗ് ചെയ്തുകൊണ്ടും AI അപാകതകൾ കണ്ടെത്തുന്നു. മികച്ച സിസ്റ്റങ്ങൾ വിജയിക്കുന്നത് മിന്നുന്ന രീതിയിലല്ല, മറിച്ച് കാലിബ്രേറ്റ് ചെയ്ത : സെഗ്മെന്റഡ് ബേസ്ലൈനുകൾ, അലേർട്ട് ബജറ്റുകൾ, വ്യാഖ്യാനിക്കാവുന്ന ഔട്ട്പുട്ടുകൾ, ശബ്ദായമാനമായ അലാറങ്ങളെ വിശ്വസനീയമായ സിഗ്നലാക്കി മാറ്റുന്ന ഒരു ഫീഡ്ബാക്ക് ലൂപ്പ്. [1]
അവലംബം
-
പിമെന്റൽ തുടങ്ങിയവർ (2014) - പുതുമ കണ്ടെത്തലിന്റെ ഒരു അവലോകനം (PDF, ഓക്സ്ഫോർഡ് സർവകലാശാല) കൂടുതൽ വായിക്കുക
-
സ്കൈകിറ്റ്-ലേൺ ഡോക്യുമെന്റേഷൻ - പുതുമയും ഔട്ട്ലിയർ ഡിറ്റക്ഷനും കൂടുതൽ വായിക്കുക
-
NIST/SEMATECH ഇ-ഹാൻഡ്ബുക്ക് - ഔട്ട്ലൈയറുകളുടെ കണ്ടെത്തൽ കൂടുതൽ വായിക്കുക , NIST CSRC - SP 800-94 (ഫൈനൽ): ഇൻട്രൂഷൻ ഡിറ്റക്ഷൻ ആൻഡ് പ്രിവൻഷൻ സിസ്റ്റങ്ങൾ (IDPS) ഗൈഡ് കൂടുതൽ വായിക്കുക
-
സൈറ്റോ & റെഹ്ംസ്മിയർ (2015) - ഇംബാലൻസ്ഡ് ഡാറ്റാസെറ്റുകളിൽ ബൈനറി ക്ലാസിഫയറുകൾ വിലയിരുത്തുമ്പോൾ (PLOS ONE) കൂടുതൽ വായിക്കുക
-
മോൾനാർ - ഇന്റർപ്രെറ്റബിൾ മെഷീൻ ലേണിംഗ് (വെബ് ബുക്ക്) കൂടുതൽ വായിക്കുക