അനലിറ്റിക്സ് ട്രാക്കിംഗ്: സ്വകാര്യത-ആദ്യ ഇവന്റ് ശേഖരണം
ബോട്ട് ട്രാഫിക്ക് ഒഴിവാക്കിക്കൊണ്ട് സ്വകാര്യത ആദരിച്ചുകൊണ്ട് ഉപയോക്തൃ പെരുമാറ്റം എങ്ങനെ ട്രാക്ക് ചെയ്യുന്നു എന്ന് ഈ ലേഖനം വിശദീകരിക്കുന്നു.
പ്രശ്നം: ഉപയോക്തൃ പെരുമാറ്റം മനസ്സിലാക്കൽ
നമുക്ക് അറിയേണ്ടതുണ്ട്:
-
ഉപയോക്താക്കൾ ഏത് പേജുകൾ സന്ദർശിക്കുന്നു
-
അവർ ഏത് ഉൽപ്പന്നങ്ങൾ കാണുന്നു
-
ട്രാഫിക് എവിടെ നിന്ന് വരുന്നു (ഗൂഗിൾ ആഡ്സ്, ഓർഗാനിക്, സോഷ്യൽ)
-
ഏത് കാമ്പെയ്നുകളാണ് കൺവേർഷനുകൾ നയിക്കുന്നത്
പക്ഷേ നമ്മൾ ഒഴിവാക്കേണ്ടതുണ്ട്:
-
ബോട്ടുകളും ക്രോളറുകളും ട്രാക്ക് ചെയ്യുന്നത്
-
വ്യക്തിപരമായി തിരിച്ചറിയാവുന്ന വിവരങ്ങൾ (PII) സംഭരിക്കുന്നത്
-
സ്വകാര്യത നിയന്ത്രണങ്ങൾ ലംഘിക്കുന്നത്
പരിഹാരം: ക്ലയന്റ്-സൈഡ് + സെർവർ-സൈഡ് ട്രാക്കിംഗ്
ക്ലയന്റ്-സൈഡ്: ജാവാസ്ക്രിപ്റ്റ് ട്രാക്കിംഗ്
വിസിറ്റർ ഐഡി: ക്രമരഹിതമായ ഐഡി കുക്കിയിൽ സംഭരിച്ചിരിക്കുന്നു (365 ദിവസം)
സെഷൻ ഐഡി: ക്രമരഹിതമായ ഐഡി സെഷൻസ്റ്റോറേജിൽ സംഭരിച്ചിരിക്കുന്നു (ബ്രൗസർ അടയ്ക്കുന്നത് വരെ)
കാമ്പെയ്ൻ പാരാമീറ്ററുകൾ: URL-ൽ നിന്ന് വേർതിരിച്ചെടുത്ത് സെഷൻസ്റ്റോറേജിൽ സംഭരിക്കുന്നു
ട്രാക്ക് ചെയ്യുന്ന പാരാമീറ്ററുകൾ:
-
gclid- ഗൂഗിൾ ക്ലിക് ഐഡി (സെർച്ച് ആഡ്സ്) -
gbraid- ഗൂഗിൾ ആഡ്സ് ക്ലിക് ഐഡി (ഷോപ്പിംഗ് ആഡ്സ്) -
wbraid- ഗൂഗിൾ ആഡ്സ് ക്ലിക് ഐഡി (iOS) -
fbclid- ഫേസ്ബുക്ക് ക്ലിക് ഐഡി -
srsltid- ഗൂഗിൾ ഓർഗാനിക് സെർച്ച് ഫല ഐഡി -
utm_source,utm_medium,utm_campaign,utm_term,utm_content
സംഭരണം: വാട്ട്സ്ആപ്പ്/ഫോൺ ക്ലിക് അട്രിബ്യൂഷനായി പാരാമീറ്ററുകൾ കുക്കികളിൽ സംഭരിച്ചിരിക്കുന്നു (30 മിനിറ്റ്)
സെർവർ-സൈഡ്: സമ്പന്നീകരണം
സെർവർ ഇവന്റുകളെ ഇവയുമായി സമ്പന്നമാക്കുന്നു:
ജിയോഐപി ഡാറ്റ: ഐപി വിലാസത്തിൽ നിന്നുള്ള രാജ്യം, പ്രദേശം, നഗരം
യൂസർ-ഏജന്റ് പാർസിംഗ്: ബ്രൗസർ, ഓപ്പറേറ്റിംഗ് സിസ്റ്റം, ഉപകരണ തരം
ടൈംസ്റ്റാമ്പ്: സെർവർ സമയം (UTC)
ബോട്ട് കണ്ടെത്തൽ: അറിയപ്പെടുന്ന ബോട്ട് യൂസർ-ഏജന്റുകൾ ഫിൽട്ടർ ചെയ്യുന്നു
ഇവന്റ് തരങ്ങൾ
പേജ് വ്യൂ: ഉപയോക്താവ് ഒരു പേജ് സന്ദർശിക്കുന്നു
ഉൽപ്പന്ന വ്യൂ: ഉപയോക്താവ് ഉൽപ്പന്ന പേജ് കാണുന്നു
കാർട്ടിലേക്ക് ചേർക്കുക: ഉപയോക്താവ് ഉൽപ്പന്നം കാർട്ടിലേക്ക് ചേർക്കുന്നു
ചെക്കൗട്ട്: ഉപയോക്താവ് ചെക്കൗട്ട് ആരംഭിക്കുന്നു
പർച്ചേസ്: ഉപയോക്താവ് വാങ്ങൽ പൂർത്തിയാക്കുന്നു
വാട്ട്സ്ആപ്പ് ക്ലിക്: ഉപയോക്താവ് വാട്ട്സ്ആപ്പ് ബട്ടൺ ക്ലിക്ക് ചെയ്യുന്നു
ഫോൺ ക്ലിക്: ഉപയോക്താവ് ഫോൺ നമ്പർ ക്ലിക്ക് ചെയ്യുന്നു
ഡാറ്റ ഫ്ലോ
sequenceDiagram
participant User
participant JS as JavaScript
participant API as /api/analytics
participant Firehose as Kinesis Firehose
participant S3
User->>JS: Visit page
JS->>JS: Extract URL params
(gclid, utm_*, etc.)
JS->>JS: Store in sessionStorage
JS->>API: POST event + params
API->>API: Enrich with GeoIP
API->>API: Parse User-Agent
API->>API: Filter bots
API->>Firehose: Send enriched event
Firehose->>S3: Store in analytics bucketബോട്ട് കണ്ടെത്തൽ
നിരവധി സിഗ്നലുകൾ ഉപയോഗിച്ച് ഞങ്ങൾ ബോട്ട് ട്രാഫിക് ഫിൽട്ടർ ചെയ്യുന്നു:
യൂസർ-ഏജന്റ് പാറ്റേണുകൾ: അറിയപ്പെടുന്ന ബോട്ട് സ്ട്രിംഗുകൾ (Googlebot, Bingbot, മറ്റുള്ളവ)
പെരുമാറ്റ പാറ്റേണുകൾ: വളരെ വേഗത, വളരെയധികം അഭ്യർത്ഥനകൾ
ജാവാസ്ക്രിപ്റ്റ് നഷ്ടമായത്: ബോട്ടുകൾ പലപ്പോഴും JS എക്സിക്യൂട്ട് ചെയ്യാറില്ല
ഒഴിവാക്കൽ കുക്കി: tv_exclude=true എല്ലാ ട്രാക്കിംഗും നിർത്തുന്നു
സ്വകാര്യത സംരക്ഷണം
PII ഇല്ല: ഞങ്ങൾ ഒരിക്കലും പേരുകൾ, ഇമെയിലുകൾ, ഫോൺ നമ്പറുകൾ സംഭരിക്കുന്നില്ല
അജ്ഞാതമാക്കിയ ഐപികൾ: സംഭരണത്തിന് മുമ്പ് അവസാന ഒക്റ്ററ്റ് നീക്കം ചെയ്തു
ക്രോസ്-സൈറ്റ് ട്രാക്കിംഗ് ഇല്ല: കുക്കികൾ ഫസ്റ്റ്-പാർട്ടി മാത്രമാണ്
ഒപ്റ്റ്-ഔട്ട്: ഉപയോക്താക്കൾക്ക് ഒഴിവാക്കൽ കുക്കി സജ്ജമാക്കാൻ കഴിയും
ഡാറ്റ നിലനിർത്തൽ: 90 ദിവസത്തിന് ശേഷം ഇവന്റുകൾ ഇല്ലാതാക്കുന്നു
കണ്ടീഷണൽ പിക്സൽ ലോഡിംഗ്
അനുബന്ധമായിരിക്കുമ്പോൾ മാത്രമേ ഞങ്ങൾ ട്രാക്കിംഗ് പിക്സലുകൾ ലോഡ് ചെയ്യുന്നുള്ളൂ:
ഗൂഗിൾ ആഡ്സ് പിക്സൽ: gclid, gbraid, അല്ലെങ്കിൽ wbraid ഉണ്ടെങ്കിൽ മാത്രം
ലിങ്ക്ഡ്ഇൻ പിക്സൽ: msclkid ഉണ്ടെങ്കിൽ മാത്രം
ഫേസ്ബുക്ക് പിക്സൽ: fbclid ഉണ്ടെങ്കിൽ മാത്രം
പ്രയോജനം: വേഗതയുള്ള പേജ് ലോഡുകൾ, കുറഞ്ഞ ട്രാക്കിംഗ് ഓവർഹെഡ്
ട്രാഫിക് സോഴ്സ് കണ്ടെത്തൽ
URL പാരാമീറ്ററുകളിൽ നിന്ന് ഞങ്ങൾ ട്രാഫിക് സോഴ്സ് കണ്ടെത്തുന്നു:
ഗൂഗിൾ ആഡ്സ്: gclid, gbraid, wbraid → utm_source=google_ads
ഗൂഗിൾ ഓർഗാനിക്: srsltid → utm_source=google_search
ഫേസ്ബുക്ക്: fbclid → utm_source=facebook
ലിങ്ക്ഡ്ഇൻ: msclkid → utm_source=linkedin
നേരിട്ടുള്ളത്: പാരാമീറ്ററുകളില്ല → utm_source=direct
കൺവേർഷൻ ട്രാക്കിംഗ്
ഫണലിലൂടെ ഞങ്ങൾ കൺവേർഷനുകൾ ട്രാക്ക് ചെയ്യുന്നു:
ഉൽപ്പന്ന വ്യൂ → കാർട്ടിലേക്ക് ചേർക്കുക → ചെക്കൗട്ട് → പർച്ചേസ്
ഓരോ ഘട്ടത്തിലും ഇവ ഉൾപ്പെടുന്നു:
-
വിസിറ്റർ ഐഡി (അട്രിബ്യൂഷനായി)
-
സെഷൻ ഐഡി (സെഷൻ വിശകലനത്തിനായി)
-
കാമ്പെയ്ൻ പാരാമീറ്ററുകൾ (ROI കണക്കുകൂട്ടലിനായി)
-
ഉൽപ്പന്ന SKU (ഉൽപ്പന്ന വിശകലനത്തിനായി)
ലീഡ് ടച്ച് ട്രാക്കിംഗ്
ഉപയോക്താക്കൾ ഞങ്ങളെ സമീപിക്കുമ്പോൾ (വാട്ട്സ്ആപ്പ്, ഫോൺ, ഇമെയിൽ), ഞങ്ങൾ ഇവ പിടിച്ചെടുക്കുന്നു:
സമ്പർക്ക രീതി: വാട്ട്സ്ആപ്പ്, ഫോൺ, ഇമെയിൽ
കാമ്പെയ്ൻ പാരാമീറ്ററുകൾ: കുക്കികളിൽ നിന്ന് (30-മിനിറ്റ് വിൻഡോ)
ഉൽപ്പന്ന സന്ദർഭം: അവർ ഏത് ഉൽപ്പന്ന പേജിലായിരുന്നു
പ്രയോജനം: ഓഫ്ലൈൻ കൺവേർഷനുകൾ ഓൺലൈൻ കാമ്പെയ്നുകളിലേക്ക് അട്രിബ്യൂട്ട് ചെയ്യുക
റേറ്റ് ലിമിറ്റിംഗ്
അനലിറ്റിക്സ് എൻഡ്പോയിന്റ് റേറ്റ്-ലിമിറ്റ് ചെയ്തിരിക്കുന്നു:
പരിധി: ഓരോ ഐപിക്കും 10 മിനിറ്റിനുള്ളിൽ 100 അഭ്യർത്ഥനകൾ
പ്രയോജനം: ദുരുപയോഗവും ബോട്ട് വെള്ളപ്പൊക്കവും തടയുന്നു
സംഭരണം
ഇവന്റുകൾ കിനെസിസ് ഫയർഹോസ് വഴി S3-ൽ സംഭരിച്ചിരിക്കുന്നു:
ഫോർമാറ്റ്: JSON ലൈനുകൾ (ഒരു ഇവന്റ് ഒരു വരി)
പാർട്ടീഷൻ: തീയതി അനുസരിച്ച് (വർഷം/മാസം/ദിവസം/മണിക്കൂർ)
കംപ്രഷൻ: Gzip
നിലനിർത്തൽ: 90 ദിവസം
ക്വറി ചെയ്യൽ
AWS അഥീന വഴി ഇവന്റുകൾ ക്വറി ചെയ്യുന്നു:
സ്കീമ: ഗ്ലൂ ഡാറ്റ കാറ്റലോഗിൽ നിർവച