അനലിറ്റിക്സ് ട്രാക്കിംഗ്: സ്വകാര്യത-ആദ്യ ഇവന്റ് ശേഖരണം

ബോട്ട് ട്രാഫിക്ക് ഒഴിവാക്കിക്കൊണ്ട് സ്വകാര്യത ആദരിച്ചുകൊണ്ട് ഉപയോക്തൃ പെരുമാറ്റം എങ്ങനെ ട്രാക്ക് ചെയ്യുന്നു എന്ന് ഈ ലേഖനം വിശദീകരിക്കുന്നു.

പ്രശ്നം: ഉപയോക്തൃ പെരുമാറ്റം മനസ്സിലാക്കൽ

നമുക്ക് അറിയേണ്ടതുണ്ട്:

  • ഉപയോക്താക്കൾ ഏത് പേജുകൾ സന്ദർശിക്കുന്നു

  • അവർ ഏത് ഉൽപ്പന്നങ്ങൾ കാണുന്നു

  • ട്രാഫിക് എവിടെ നിന്ന് വരുന്നു (ഗൂഗിൾ ആഡ്‌സ്, ഓർഗാനിക്, സോഷ്യൽ)

  • ഏത് കാമ്പെയ്‌നുകളാണ് കൺവേർഷനുകൾ നയിക്കുന്നത്

പക്ഷേ നമ്മൾ ഒഴിവാക്കേണ്ടതുണ്ട്:

  • ബോട്ടുകളും ക്രോളറുകളും ട്രാക്ക് ചെയ്യുന്നത്

  • വ്യക്തിപരമായി തിരിച്ചറിയാവുന്ന വിവരങ്ങൾ (PII) സംഭരിക്കുന്നത്

  • സ്വകാര്യത നിയന്ത്രണങ്ങൾ ലംഘിക്കുന്നത്

പരിഹാരം: ക്ലയന്റ്-സൈഡ് + സെർവർ-സൈഡ് ട്രാക്കിംഗ്

ക്ലയന്റ്-സൈഡ്: ജാവാസ്ക്രിപ്റ്റ് ട്രാക്കിംഗ്

വിസിറ്റർ ഐഡി: ക്രമരഹിതമായ ഐഡി കുക്കിയിൽ സംഭരിച്ചിരിക്കുന്നു (365 ദിവസം)

സെഷൻ ഐഡി: ക്രമരഹിതമായ ഐഡി സെഷൻസ്റ്റോറേജിൽ സംഭരിച്ചിരിക്കുന്നു (ബ്രൗസർ അടയ്ക്കുന്നത് വരെ)

കാമ്പെയ്‌ൻ പാരാമീറ്ററുകൾ: URL-ൽ നിന്ന് വേർതിരിച്ചെടുത്ത് സെഷൻസ്റ്റോറേജിൽ സംഭരിക്കുന്നു

ട്രാക്ക് ചെയ്യുന്ന പാരാമീറ്ററുകൾ:

  • gclid - ഗൂഗിൾ ക്ലിക് ഐഡി (സെർച്ച് ആഡ്‌സ്)

  • gbraid - ഗൂഗിൾ ആഡ്‌സ് ക്ലിക് ഐഡി (ഷോപ്പിംഗ് ആഡ്‌സ്)

  • wbraid - ഗൂഗിൾ ആഡ്‌സ് ക്ലിക് ഐഡി (iOS)

  • fbclid - ഫേസ്ബുക്ക് ക്ലിക് ഐഡി

  • srsltid - ഗൂഗിൾ ഓർഗാനിക് സെർച്ച് ഫല ഐഡി

  • utm_source, utm_medium, utm_campaign, utm_term, utm_content

സംഭരണം: വാട്ട്‌സ്ആപ്പ്/ഫോൺ ക്ലിക് അട്രിബ്യൂഷനായി പാരാമീറ്ററുകൾ കുക്കികളിൽ സംഭരിച്ചിരിക്കുന്നു (30 മിനിറ്റ്)

സെർവർ-സൈഡ്: സമ്പന്നീകരണം

സെർവർ ഇവന്റുകളെ ഇവയുമായി സമ്പന്നമാക്കുന്നു:

ജിയോഐപി ഡാറ്റ: ഐപി വിലാസത്തിൽ നിന്നുള്ള രാജ്യം, പ്രദേശം, നഗരം

യൂസർ-ഏജന്റ് പാർസിംഗ്: ബ്രൗസർ, ഓപ്പറേറ്റിംഗ് സിസ്റ്റം, ഉപകരണ തരം

ടൈംസ്റ്റാമ്പ്: സെർവർ സമയം (UTC)

ബോട്ട് കണ്ടെത്തൽ: അറിയപ്പെടുന്ന ബോട്ട് യൂസർ-ഏജന്റുകൾ ഫിൽട്ടർ ചെയ്യുന്നു

ഇവന്റ് തരങ്ങൾ

പേജ് വ്യൂ: ഉപയോക്താവ് ഒരു പേജ് സന്ദർശിക്കുന്നു

ഉൽപ്പന്ന വ്യൂ: ഉപയോക്താവ് ഉൽപ്പന്ന പേജ് കാണുന്നു

കാർട്ടിലേക്ക് ചേർക്കുക: ഉപയോക്താവ് ഉൽപ്പന്നം കാർട്ടിലേക്ക് ചേർക്കുന്നു

ചെക്കൗട്ട്: ഉപയോക്താവ് ചെക്കൗട്ട് ആരംഭിക്കുന്നു

പർച്ചേസ്: ഉപയോക്താവ് വാങ്ങൽ പൂർത്തിയാക്കുന്നു

വാട്ട്‌സ്ആപ്പ് ക്ലിക്: ഉപയോക്താവ് വാട്ട്‌സ്ആപ്പ് ബട്ടൺ ക്ലിക്ക് ചെയ്യുന്നു

ഫോൺ ക്ലിക്: ഉപയോക്താവ് ഫോൺ നമ്പർ ക്ലിക്ക് ചെയ്യുന്നു

ഡാറ്റ ഫ്ലോ

sequenceDiagram
    participant User
    participant JS as JavaScript
    participant API as /api/analytics
    participant Firehose as Kinesis Firehose
    participant S3
    
    User->>JS: Visit page
    JS->>JS: Extract URL params
(gclid, utm_*, etc.) JS->>JS: Store in sessionStorage JS->>API: POST event + params API->>API: Enrich with GeoIP API->>API: Parse User-Agent API->>API: Filter bots API->>Firehose: Send enriched event Firehose->>S3: Store in analytics bucket

ബോട്ട് കണ്ടെത്തൽ

നിരവധി സിഗ്നലുകൾ ഉപയോഗിച്ച് ഞങ്ങൾ ബോട്ട് ട്രാഫിക് ഫിൽട്ടർ ചെയ്യുന്നു:

യൂസർ-ഏജന്റ് പാറ്റേണുകൾ: അറിയപ്പെടുന്ന ബോട്ട് സ്ട്രിംഗുകൾ (Googlebot, Bingbot, മറ്റുള്ളവ)

പെരുമാറ്റ പാറ്റേണുകൾ: വളരെ വേഗത, വളരെയധികം അഭ്യർത്ഥനകൾ

ജാവാസ്ക്രിപ്റ്റ് നഷ്ടമായത്: ബോട്ടുകൾ പലപ്പോഴും JS എക്സിക്യൂട്ട് ചെയ്യാറില്ല

ഒഴിവാക്കൽ കുക്കി: tv_exclude=true എല്ലാ ട്രാക്കിംഗും നിർത്തുന്നു

സ്വകാര്യത സംരക്ഷണം

PII ഇല്ല: ഞങ്ങൾ ഒരിക്കലും പേരുകൾ, ഇമെയിലുകൾ, ഫോൺ നമ്പറുകൾ സംഭരിക്കുന്നില്ല

അജ്ഞാതമാക്കിയ ഐപികൾ: സംഭരണത്തിന് മുമ്പ് അവസാന ഒക്റ്ററ്റ് നീക്കം ചെയ്തു

ക്രോസ്-സൈറ്റ് ട്രാക്കിംഗ് ഇല്ല: കുക്കികൾ ഫസ്റ്റ്-പാർട്ടി മാത്രമാണ്

ഒപ്റ്റ്-ഔട്ട്: ഉപയോക്താക്കൾക്ക് ഒഴിവാക്കൽ കുക്കി സജ്ജമാക്കാൻ കഴിയും

ഡാറ്റ നിലനിർത്തൽ: 90 ദിവസത്തിന് ശേഷം ഇവന്റുകൾ ഇല്ലാതാക്കുന്നു

കണ്ടീഷണൽ പിക്സൽ ലോഡിംഗ്

അനുബന്ധമായിരിക്കുമ്പോൾ മാത്രമേ ഞങ്ങൾ ട്രാക്കിംഗ് പിക്സലുകൾ ലോഡ് ചെയ്യുന്നുള്ളൂ:

ഗൂഗിൾ ആഡ്‌സ് പിക്സൽ: gclid, gbraid, അല്ലെങ്കിൽ wbraid ഉണ്ടെങ്കിൽ മാത്രം

ലിങ്ക്ഡ്ഇൻ പിക്സൽ: msclkid ഉണ്ടെങ്കിൽ മാത്രം

ഫേസ്ബുക്ക് പിക്സൽ: fbclid ഉണ്ടെങ്കിൽ മാത്രം

പ്രയോജനം: വേഗതയുള്ള പേജ് ലോഡുകൾ, കുറഞ്ഞ ട്രാക്കിംഗ് ഓവർഹെഡ്

ട്രാഫിക് സോഴ്‌സ് കണ്ടെത്തൽ

URL പാരാമീറ്ററുകളിൽ നിന്ന് ഞങ്ങൾ ട്രാഫിക് സോഴ്‌സ് കണ്ടെത്തുന്നു:

ഗൂഗിൾ ആഡ്‌സ്: gclid, gbraid, wbraidutm_source=google_ads

ഗൂഗിൾ ഓർഗാനിക്: srsltidutm_source=google_search

ഫേസ്ബുക്ക്: fbclidutm_source=facebook

ലിങ്ക്ഡ്ഇൻ: msclkidutm_source=linkedin

നേരിട്ടുള്ളത്: പാരാമീറ്ററുകളില്ല → utm_source=direct

കൺവേർഷൻ ട്രാക്കിംഗ്

ഫണലിലൂടെ ഞങ്ങൾ കൺവേർഷനുകൾ ട്രാക്ക് ചെയ്യുന്നു:

ഉൽപ്പന്ന വ്യൂകാർട്ടിലേക്ക് ചേർക്കുകചെക്കൗട്ട്പർച്ചേസ്

ഓരോ ഘട്ടത്തിലും ഇവ ഉൾപ്പെടുന്നു:

  • വിസിറ്റർ ഐഡി (അട്രിബ്യൂഷനായി)

  • സെഷൻ ഐഡി (സെഷൻ വിശകലനത്തിനായി)

  • കാമ്പെയ്‌ൻ പാരാമീറ്ററുകൾ (ROI കണക്കുകൂട്ടലിനായി)

  • ഉൽപ്പന്ന SKU (ഉൽപ്പന്ന വിശകലനത്തിനായി)

ലീഡ് ടച്ച് ട്രാക്കിംഗ്

ഉപയോക്താക്കൾ ഞങ്ങളെ സമീപിക്കുമ്പോൾ (വാട്ട്‌സ്ആപ്പ്, ഫോൺ, ഇമെയിൽ), ഞങ്ങൾ ഇവ പിടിച്ചെടുക്കുന്നു:

സമ്പർക്ക രീതി: വാട്ട്‌സ്ആപ്പ്, ഫോൺ, ഇമെയിൽ

കാമ്പെയ്‌ൻ പാരാമീറ്ററുകൾ: കുക്കികളിൽ നിന്ന് (30-മിനിറ്റ് വിൻഡോ)

ഉൽപ്പന്ന സന്ദർഭം: അവർ ഏത് ഉൽപ്പന്ന പേജിലായിരുന്നു

പ്രയോജനം: ഓഫ്‌ലൈൻ കൺവേർഷനുകൾ ഓൺലൈൻ കാമ്പെയ്‌നുകളിലേക്ക് അട്രിബ്യൂട്ട് ചെയ്യുക

റേറ്റ് ലിമിറ്റിംഗ്

അനലിറ്റിക്സ് എൻഡ്‌പോയിന്റ് റേറ്റ്-ലിമിറ്റ് ചെയ്തിരിക്കുന്നു:

പരിധി: ഓരോ ഐപിക്കും 10 മിനിറ്റിനുള്ളിൽ 100 അഭ്യർത്ഥനകൾ

പ്രയോജനം: ദുരുപയോഗവും ബോട്ട് വെള്ളപ്പൊക്കവും തടയുന്നു

സംഭരണം

ഇവന്റുകൾ കിനെസിസ് ഫയർഹോസ് വഴി S3-ൽ സംഭരിച്ചിരിക്കുന്നു:

ഫോർമാറ്റ്: JSON ലൈനുകൾ (ഒരു ഇവന്റ് ഒരു വരി)

പാർട്ടീഷൻ: തീയതി അനുസരിച്ച് (വർഷം/മാസം/ദിവസം/മണിക്കൂർ)

കംപ്രഷൻ: Gzip

നിലനിർത്തൽ: 90 ദിവസം

ക്വറി ചെയ്യൽ

AWS അഥീന വഴി ഇവന്റുകൾ ക്വറി ചെയ്യുന്നു:

സ്കീമ: ഗ്ലൂ ഡാറ്റ കാറ്റലോഗിൽ നിർവച