विश्लेषण ट्रॅकिंग: गोपनीयता-प्रथम इव्हेंट संकलन

हा लेख स्पष्ट करतो की आम्ही वापरकर्ता वर्तनाचा मागोवा कसा ठेवतो तर गोपनीयतेचा आदर करत आणि बॉट ट्रॅफिक टाळत.

समस्या: वापरकर्ता वर्तन समजून घेणे

आम्हाला हे माहित असणे आवश्यक आहे:

  • वापरकर्ते कोणते पृष्ठ भेट देतात

  • ते कोणते उत्पादने पाहतात

  • ट्रॅफिक कोठून येते (Google Ads, ऑर्गॅनिक, सोशल)

  • कोणते मोहिम रूपांतरणे घडवून आणतात

परंतु आम्ही हे टाळले पाहिजे:

  • बॉट्स आणि क्रॉलर्सचा मागोवा ठेवणे

  • वैयक्तिकरित्या ओळखण्यायोग्य माहिती (PII) साठवणे

  • गोपनीयता नियमांचे उल्लंघन करणे

उपाय: क्लायंट-साइड + सर्व्हर-साइड ट्रॅकिंग

क्लायंट-साइड: JavaScript ट्रॅकिंग

भेट देणार्याचे ID: कुकीमध्ये साठवलेले यादृच्छिक ID (३६५ दिवस)

सत्र ID: sessionStorage मध्ये साठवलेले यादृच्छिक ID (ब्राउझर बंद होईपर्यंत)

मोहिम पॅरामीटर्स: URL वरून काढले जातात आणि sessionStorage मध्ये साठवले जातात

ट्रॅक केलेले पॅरामीटर्स:

  • gclid - Google क्लिक ID (शोध जाहिराती)

  • gbraid - Google Ads क्लिक ID (शॉपिंग जाहिराती)

  • wbraid - Google Ads क्लिक ID (iOS)

  • fbclid - Facebook क्लिक ID

  • srsltid - Google ऑर्गॅनिक शोध निकाल ID

  • utm_source, utm_medium, utm_campaign, utm_term, utm_content

साठवणूक: WhatsApp/फोन क्लिक आरोपणासाठी पॅरामीटर्स कुकीजमध्ये साठवले जातात (३० मिनिटे)

सर्व्हर-साइड: समृद्धीकरण

सर्व्हर इव्हेंट्सना यासह समृद्ध करतो:

GeoIP डेटा: IP पत्त्यावरून देश, प्रदेश, शहर

यूझर-एजंट पार्सिंग: ब्राउझर, OS, उपकरण प्रकार

टाइमस्टॅम्प: सर्व्हर वेळ (UTC)

बॉट शोध: ओळखल्या गेलेल्या बॉट यूझर-एजंट्स फिल्टर करतो

इव्हेंट प्रकार

पृष्ठ दृश्य: वापरकर्ता पृष्ठ भेट देतो

उत्पादन दृश्य: वापरकर्ता उत्पादन पृष्ठ पाहतो

कार्टमध्ये जोडा: वापरकर्ता उत्पादन कार्टमध्ये जोडतो

चेकआउट: वापरकर्ता चेकआउट सुरू करतो

खरेदी: वापरकर्ता खरेदी पूर्ण करतो

WhatsApp क्लिक: वापरकर्ता WhatsApp बटणावर क्लिक करतो

फोन क्लिक: वापरकर्ता फोन नंबरवर क्लिक करतो

डेटा प्रवाह

sequenceDiagram
    participant User
    participant JS as JavaScript
    participant API as /api/analytics
    participant Firehose as Kinesis Firehose
    participant S3
    
    User->>JS: Visit page
    JS->>JS: Extract URL params
(gclid, utm_*, etc.) JS->>JS: Store in sessionStorage JS->>API: POST event + params API->>API: Enrich with GeoIP API->>API: Parse User-Agent API->>API: Filter bots API->>Firehose: Send enriched event Firehose->>S3: Store in analytics bucket

बॉट शोध

आम्ही अनेक सिग्नल्सचा वापर करून बॉट ट्रॅफिक फिल्टर करतो:

यूझर-एजंट पॅटर्न: ओळखल्या गेलेल्या बॉट स्ट्रिंग्ज (Googlebot, Bingbot, इ.)

वर्तन पॅटर्न: खूप वेगवान, खूप जास्त विनंत्या

JavaScript गहाळ: बॉट्स अनेकदा JS चालवत नाहीत

वगळण्याची कुकी: tv_exclude=true सर्व ट्रॅकिंग थांबवते

गोपनीयता संरक्षण

PII नाही: आम्ही कधीही नावे, ईमेल, फोन नंबर साठवत नाही

अनामित IPs: साठवण्यापूर्वी शेवटचा ऑक्टेट काढला जातो

क्रॉस-साइट ट्रॅकिंग नाही: कुकीज फक्त फर्स्ट-पार्टी आहेत

ऑप्ट-आउट: वापरकर्ते वगळण्याची कुकी सेट करू शकतात

डेटा रिटेंशन: इव्हेंट्स ९० दिवसांनंतर हटवल्या जातात

सशर्त पिक्सेल लोडिंग

आम्ही फक्त संबंधित असल्यास ट्रॅकिंग पिक्सेल लोड करतो:

Google Ads पिक्सेल: फक्त जर gclid, gbraid, किंवा wbraid उपस्थित असेल तर

LinkedIn पिक्सेल: फक्त जर msclkid उपस्थित असेल तर

Facebook पिक्सेल: फक्त जर fbclid उपस्थित असेल तर

फायदा: वेगवान पृष्ठ लोड, कमी ट्रॅकिंग ओव्हरहेड

ट्रॅफिक स्रोत शोध

आम्ही URL पॅरामीटर्सवरून ट्रॅफिक स्रोत शोधतो:

Google Ads: gclid, gbraid, wbraidutm_source=google_ads

Google ऑर्गॅनिक: srsltidutm_source=google_search

Facebook: fbclidutm_source=facebook

LinkedIn: msclkidutm_source=linkedin

डायरेक्ट: पॅरामीटर्स नाहीत → utm_source=direct

रूपांतरण ट्रॅकिंग

आम्ही फनेलद्वारे रूपांतरणे ट्रॅक करतो:

उत्पादन दृश्यकार्टमध्ये जोडाचेकआउटखरेदी

प्रत्येक चरणात हे समाविष्ट आहे:

  • भेट देणार्याचे ID (आरोपणासाठी)

  • सत्र ID (सत्र विश्लेषणासाठी)

  • मोहिम पॅरामीटर्स (ROI गणनेसाठी)

  • उत्पादन SKU (उत्पादन विश्लेषणासाठी)

लीड टच ट्रॅकिंग

जेव्हा वापरकर्ते आमच्याशी संपर्क साधतात (WhatsApp, फोन, ईमेल), तेव्हा आम्ही हे कॅप्चर करतो:

संपर्क पद्धत: WhatsApp, फोन, ईमेल

मोहिम पॅरामीटर्स: कुकीजवरून (३०-मिनिट विंडो)

उत्पादन संदर्भ: ते कोणत्या उत्पादन पृष्ठावर होते

फायदा: ऑफलाइन रूपांतरणे ऑनलाइन मोहिमांना आरोपित करा

रेट लिमिटिंग

विश्लेषण एंडपॉइंट रेट-लिमिटेड आहे:

मर्यादा: प्रति IP १० मिनिटांत १०० विनंत्या

फायदा: गैरवापर आणि बॉट फ्लड प्रतिबंधित करते

साठवणूक

इव्हेंट्स Kinesis Firehose द्वारे S3 मध्ये साठवल्या जातात:

स्वरूप: JSON ओळी (प्रति ओळ एक इव्हेंट)

विभाजन: तारखेनुसार (वर्ष/महिना/दिवस/तास)

कंप्रेशन: Gzip

रिटेंशन: ९० दिवस

क्वेरी करणे

इव्हेंट्स AWS Athena द्वारे क्वेरी केल्या जातात:

स्कीमा: Glue Data Catalog मध्ये परिभाषित

क्वेरीज: S3 डेटावर SQL

वापर प्रकरणे: मोहिम ROI, उत्पादन लोकप्रियता, ट्रॅफिक स्रोत

संदर्भ

तांत्रिक संकल्पना

AWS सेवा

संबंधित लेख

सारांश

आमची विश्लेषण प्रणाली गोपनीयतेचा आदर करताना वापरकर्ता वर्तन ट्रॅक करते:

क्लायंट-साइड:

  • ✅ URL वरून मोहिम पॅरामीटर्स काढा

  • ✅ sessionStorage मध्ये साठवा (सत्र-स्कोप केलेले)

  • ✅ कुकीजमध्ये साठवा (आरोपणासाठी ३० मिनिटे)

  • ✅ इव्हेंट्स API वर पाठवा

सर्व्हर-साइड:

  • ✅ GeoIP आणि User-Agent सह समृद्ध करा

  • ✅ बॉट ट्रॅफिक फिल्टर करा

  • ✅ Kinesis Firehose वर पाठवा

  • ✅ S3 मध्ये साठवा (तारखेनुसार विभाजित)

गोपनीयता:

  • ✅ PII साठवलेले नाही

  • ✅ अनामित IPs

  • ✅ फक्त फर्स्ट-पार्टी कुकीज

  • ✅ ऑप्ट-आउट उपलब्ध

  • ✅ ९०-दिवस रिटेंशन

सशर्त लोडिंग:

  • ✅ Google Ads पिक्सेल फक्त जर gclid उपस्थित असेल तर

  • ✅ LinkedIn पिक्सेल फक्त जर msclkid उपस्थित असेल तर

  • ✅ Facebook पिक्सेल फक्त जर fbclid उपस्थित असेल तर

हा दृष्टिकोन अंतर्दृष्टी आणि गोपनीयता आणि कार्यक्षमता यांच्यात संतुलन राखतो.


← दस्तऐवजीकरण अनुक्रमणिका परत जा