विश्लेषण ट्रॅकिंग: गोपनीयता-प्रथम इव्हेंट संकलन
हा लेख स्पष्ट करतो की आम्ही वापरकर्ता वर्तनाचा मागोवा कसा ठेवतो तर गोपनीयतेचा आदर करत आणि बॉट ट्रॅफिक टाळत.
समस्या: वापरकर्ता वर्तन समजून घेणे
आम्हाला हे माहित असणे आवश्यक आहे:
-
वापरकर्ते कोणते पृष्ठ भेट देतात
-
ते कोणते उत्पादने पाहतात
-
ट्रॅफिक कोठून येते (Google Ads, ऑर्गॅनिक, सोशल)
-
कोणते मोहिम रूपांतरणे घडवून आणतात
परंतु आम्ही हे टाळले पाहिजे:
-
बॉट्स आणि क्रॉलर्सचा मागोवा ठेवणे
-
वैयक्तिकरित्या ओळखण्यायोग्य माहिती (PII) साठवणे
-
गोपनीयता नियमांचे उल्लंघन करणे
उपाय: क्लायंट-साइड + सर्व्हर-साइड ट्रॅकिंग
क्लायंट-साइड: JavaScript ट्रॅकिंग
भेट देणार्याचे ID: कुकीमध्ये साठवलेले यादृच्छिक ID (३६५ दिवस)
सत्र ID: sessionStorage मध्ये साठवलेले यादृच्छिक ID (ब्राउझर बंद होईपर्यंत)
मोहिम पॅरामीटर्स: URL वरून काढले जातात आणि sessionStorage मध्ये साठवले जातात
ट्रॅक केलेले पॅरामीटर्स:
-
gclid- Google क्लिक ID (शोध जाहिराती) -
gbraid- Google Ads क्लिक ID (शॉपिंग जाहिराती) -
wbraid- Google Ads क्लिक ID (iOS) -
fbclid- Facebook क्लिक ID -
srsltid- Google ऑर्गॅनिक शोध निकाल ID -
utm_source,utm_medium,utm_campaign,utm_term,utm_content
साठवणूक: WhatsApp/फोन क्लिक आरोपणासाठी पॅरामीटर्स कुकीजमध्ये साठवले जातात (३० मिनिटे)
सर्व्हर-साइड: समृद्धीकरण
सर्व्हर इव्हेंट्सना यासह समृद्ध करतो:
GeoIP डेटा: IP पत्त्यावरून देश, प्रदेश, शहर
यूझर-एजंट पार्सिंग: ब्राउझर, OS, उपकरण प्रकार
टाइमस्टॅम्प: सर्व्हर वेळ (UTC)
बॉट शोध: ओळखल्या गेलेल्या बॉट यूझर-एजंट्स फिल्टर करतो
इव्हेंट प्रकार
पृष्ठ दृश्य: वापरकर्ता पृष्ठ भेट देतो
उत्पादन दृश्य: वापरकर्ता उत्पादन पृष्ठ पाहतो
कार्टमध्ये जोडा: वापरकर्ता उत्पादन कार्टमध्ये जोडतो
चेकआउट: वापरकर्ता चेकआउट सुरू करतो
खरेदी: वापरकर्ता खरेदी पूर्ण करतो
WhatsApp क्लिक: वापरकर्ता WhatsApp बटणावर क्लिक करतो
फोन क्लिक: वापरकर्ता फोन नंबरवर क्लिक करतो
डेटा प्रवाह
sequenceDiagram
participant User
participant JS as JavaScript
participant API as /api/analytics
participant Firehose as Kinesis Firehose
participant S3
User->>JS: Visit page
JS->>JS: Extract URL params
(gclid, utm_*, etc.)
JS->>JS: Store in sessionStorage
JS->>API: POST event + params
API->>API: Enrich with GeoIP
API->>API: Parse User-Agent
API->>API: Filter bots
API->>Firehose: Send enriched event
Firehose->>S3: Store in analytics bucketबॉट शोध
आम्ही अनेक सिग्नल्सचा वापर करून बॉट ट्रॅफिक फिल्टर करतो:
यूझर-एजंट पॅटर्न: ओळखल्या गेलेल्या बॉट स्ट्रिंग्ज (Googlebot, Bingbot, इ.)
वर्तन पॅटर्न: खूप वेगवान, खूप जास्त विनंत्या
JavaScript गहाळ: बॉट्स अनेकदा JS चालवत नाहीत
वगळण्याची कुकी: tv_exclude=true सर्व ट्रॅकिंग थांबवते
गोपनीयता संरक्षण
PII नाही: आम्ही कधीही नावे, ईमेल, फोन नंबर साठवत नाही
अनामित IPs: साठवण्यापूर्वी शेवटचा ऑक्टेट काढला जातो
क्रॉस-साइट ट्रॅकिंग नाही: कुकीज फक्त फर्स्ट-पार्टी आहेत
ऑप्ट-आउट: वापरकर्ते वगळण्याची कुकी सेट करू शकतात
डेटा रिटेंशन: इव्हेंट्स ९० दिवसांनंतर हटवल्या जातात
सशर्त पिक्सेल लोडिंग
आम्ही फक्त संबंधित असल्यास ट्रॅकिंग पिक्सेल लोड करतो:
Google Ads पिक्सेल: फक्त जर gclid, gbraid, किंवा wbraid उपस्थित असेल तर
LinkedIn पिक्सेल: फक्त जर msclkid उपस्थित असेल तर
Facebook पिक्सेल: फक्त जर fbclid उपस्थित असेल तर
फायदा: वेगवान पृष्ठ लोड, कमी ट्रॅकिंग ओव्हरहेड
ट्रॅफिक स्रोत शोध
आम्ही URL पॅरामीटर्सवरून ट्रॅफिक स्रोत शोधतो:
Google Ads: gclid, gbraid, wbraid → utm_source=google_ads
Google ऑर्गॅनिक: srsltid → utm_source=google_search
Facebook: fbclid → utm_source=facebook
LinkedIn: msclkid → utm_source=linkedin
डायरेक्ट: पॅरामीटर्स नाहीत → utm_source=direct
रूपांतरण ट्रॅकिंग
आम्ही फनेलद्वारे रूपांतरणे ट्रॅक करतो:
उत्पादन दृश्य → कार्टमध्ये जोडा → चेकआउट → खरेदी
प्रत्येक चरणात हे समाविष्ट आहे:
-
भेट देणार्याचे ID (आरोपणासाठी)
-
सत्र ID (सत्र विश्लेषणासाठी)
-
मोहिम पॅरामीटर्स (ROI गणनेसाठी)
-
उत्पादन SKU (उत्पादन विश्लेषणासाठी)
लीड टच ट्रॅकिंग
जेव्हा वापरकर्ते आमच्याशी संपर्क साधतात (WhatsApp, फोन, ईमेल), तेव्हा आम्ही हे कॅप्चर करतो:
संपर्क पद्धत: WhatsApp, फोन, ईमेल
मोहिम पॅरामीटर्स: कुकीजवरून (३०-मिनिट विंडो)
उत्पादन संदर्भ: ते कोणत्या उत्पादन पृष्ठावर होते
फायदा: ऑफलाइन रूपांतरणे ऑनलाइन मोहिमांना आरोपित करा
रेट लिमिटिंग
विश्लेषण एंडपॉइंट रेट-लिमिटेड आहे:
मर्यादा: प्रति IP १० मिनिटांत १०० विनंत्या
फायदा: गैरवापर आणि बॉट फ्लड प्रतिबंधित करते
साठवणूक
इव्हेंट्स Kinesis Firehose द्वारे S3 मध्ये साठवल्या जातात:
स्वरूप: JSON ओळी (प्रति ओळ एक इव्हेंट)
विभाजन: तारखेनुसार (वर्ष/महिना/दिवस/तास)
कंप्रेशन: Gzip
रिटेंशन: ९० दिवस
क्वेरी करणे
इव्हेंट्स AWS Athena द्वारे क्वेरी केल्या जातात:
स्कीमा: Glue Data Catalog मध्ये परिभाषित
क्वेरीज: S3 डेटावर SQL
वापर प्रकरणे: मोहिम ROI, उत्पादन लोकप्रियता, ट्रॅफिक स्रोत
संदर्भ
तांत्रिक संकल्पना
-
वेब विश्लेषण - विकिपीडिया
-
डिझाइनद्वारे गोपनीयता - विकिपीडिया
AWS सेवा
-
Kinesis Firehose - AWS दस्तऐवजीकरण
-
Athena - AWS दस्तऐवजीकरण
संबंधित लेख
- मल्टी-सर्व्हर आर्किटेक्चर - जिथे विश्लेषण चालते
सारांश
आमची विश्लेषण प्रणाली गोपनीयतेचा आदर करताना वापरकर्ता वर्तन ट्रॅक करते:
क्लायंट-साइड:
-
✅ URL वरून मोहिम पॅरामीटर्स काढा
-
✅ sessionStorage मध्ये साठवा (सत्र-स्कोप केलेले)
-
✅ कुकीजमध्ये साठवा (आरोपणासाठी ३० मिनिटे)
-
✅ इव्हेंट्स API वर पाठवा
सर्व्हर-साइड:
-
✅ GeoIP आणि User-Agent सह समृद्ध करा
-
✅ बॉट ट्रॅफिक फिल्टर करा
-
✅ Kinesis Firehose वर पाठवा
-
✅ S3 मध्ये साठवा (तारखेनुसार विभाजित)
गोपनीयता:
-
✅ PII साठवलेले नाही
-
✅ अनामित IPs
-
✅ फक्त फर्स्ट-पार्टी कुकीज
-
✅ ऑप्ट-आउट उपलब्ध
-
✅ ९०-दिवस रिटेंशन
सशर्त लोडिंग:
-
✅ Google Ads पिक्सेल फक्त जर gclid उपस्थित असेल तर
-
✅ LinkedIn पिक्सेल फक्त जर msclkid उपस्थित असेल तर
-
✅ Facebook पिक्सेल फक्त जर fbclid उपस्थित असेल तर
हा दृष्टिकोन अंतर्दृष्टी आणि गोपनीयता आणि कार्यक्षमता यांच्यात संतुलन राखतो.