تجزیاتی ٹریکنگ: رازداری پر مبنی ایونٹ کلیکشن
یہ مضمون بتاتا ہے کہ ہم رازداری کا احترام کرتے ہوئے اور بوٹ ٹریفک سے بچتے ہوئے صارف کے رویے کو کیسے ٹریک کرتے ہیں۔
مسئلہ: صارف کے رویے کو سمجھنا
ہمیں جاننے کی ضرورت ہے:
-
صارف کون سے صفحات دیکھتا ہے
-
وہ کون سی مصنوعات دیکھتے ہیں
-
ٹریفک کہاں سے آتی ہے (گوگل اشتہارات، نامیاتی، سوشل)
-
کون سی مہمات تبدیلی (کنورژن) لاتی ہیں
لیکن ہمیں ان سے بچنا ضروری ہے:
-
بوٹس اور کرالرز کو ٹریک کرنا
-
ذاتی طور پر شناخت کرنے والی معلومات (PII) ذخیرہ کرنا
-
رازداری کے ضوابط کی خلاف ورزی کرنا
حل: کلائنٹ سائیڈ + سرور سائیڈ ٹریکنگ
کلائنٹ سائیڈ: جاوا اسکرپٹ ٹریکنگ
وزیٹر آئی ڈی: بے ترتیب آئی ڈی جو کوکی میں محفوظ ہوتی ہے (365 دن)
سیشن آئی ڈی: بے ترتیب آئی ڈی جو سیشن اسٹوریج میں محفوظ ہوتی ہے (براؤزر بند ہونے تک)
مہم پیرامیٹرز: URL سے نکالے جاتے ہیں اور سیشن اسٹوریج میں محفوظ ہوتے ہیں
ٹریک کیے گئے پیرامیٹرز:
-
gclid- گوگل کلک آئی ڈی (سرچ اشتہارات) -
gbraid- گوگل اشتہارات کلک آئی ڈی (شاپنگ اشتہارات) -
wbraid- گوگل اشتہارات کلک آئی ڈی (آئی او ایس) -
fbclid- فیس بک کلک آئی ڈی -
srsltid- گوگل نامیاتی سرچ نتیجہ آئی ڈی -
utm_source,utm_medium,utm_campaign,utm_term,utm_content
ذخیرہ کاری: واٹس ایپ/فون کلک کی منسوبیت کے لیے پیرامیٹرز کوکیز میں محفوظ ہوتے ہیں (30 منٹ)
سرور سائیڈ: اضافی معلومات
سرور ایونٹس کو درج ذیل سے مزید معلومات فراہم کرتا ہے:
جیوآئی پی ڈیٹا: IP ایڈریس سے ملک، خطہ، شہر
یوزر ایجنٹ کی تشریح: براؤزر، آپریٹنگ سسٹم، آلے کی قسم
ٹائم اسٹیمپ: سرور کا وقت (UTC)
بوٹ کی شناخت: معلوم بوٹ یوزر ایجنٹس کو فلٹر کرنا
ایونٹ کی اقسام
صفحہ دیکھنا: صارف صفحہ دیکھتا ہے
مصنوعات دیکھنا: صارف مصنوعات کا صفحہ دیکھتا ہے
کارٹ میں شامل کرنا: صارف مصنوعات کو کارٹ میں شامل کرتا ہے
چیک آؤٹ: صارف چیک آؤٹ شروع کرتا ہے
خریداری: صارف خریداری مکمل کرتا ہے
واٹس ایپ کلک: صارف واٹس ایپ کے بٹن پر کلک کرتا ہے
فون کلک: صارف فون نمبر پر کلک کرتا ہے
ڈیٹا کا بہاؤ
sequenceDiagram
participant User
participant JS as JavaScript
participant API as /api/analytics
participant Firehose as Kinesis Firehose
participant S3
User->>JS: Visit page
JS->>JS: Extract URL params
(gclid, utm_*, etc.)
JS->>JS: Store in sessionStorage
JS->>API: POST event + params
API->>API: Enrich with GeoIP
API->>API: Parse User-Agent
API->>API: Filter bots
API->>Firehose: Send enriched event
Firehose->>S3: Store in analytics bucketبوٹ کی شناخت
ہم بوٹ ٹریفک کو متعدد اشاروں کا استعمال کرتے ہوئے فلٹر کرتے ہیں:
یوزر ایجنٹ پیٹرن: معلوم بوٹ سٹرنگز (گوگل بوٹ، بنگ بوٹ، وغیرہ)
رویے کے پیٹرن: بہت تیز، بہت زیادہ درخواستیں
جاوا اسکرپٹ کی عدم موجودگی: بوٹس اکثر JS چلاتے نہیں ہیں
اخراجی کوکی: tv_exclude=true تمام ٹریکنگ روک دیتی ہے
رازداری کا تحفظ
کوئی PII نہیں: ہم کبھی بھی نام، ای میلز، فون نمبرز ذخیرہ نہیں کرتے
گمنام IPs: ذخیرہ کرنے سے پہلے آخری آکٹٹ ہٹا دیا جاتا ہے
کراس سائٹ ٹریکنگ نہیں: کوکیز صرف فرسٹ پارٹی ہیں
آپٹ آؤٹ: صارف اخراجی کوکی سیٹ کر سکتے ہیں
ڈیٹا کی برقراری: ایونٹس 90 دن بعد حذف کر دیے جاتے ہیں
مشروط پکسل لوڈنگ
ہم صرف متعلقہ ہونے پر ہی ٹریکنگ پکسلز لوڈ کرتے ہیں:
گوگل اشتہارات پکسل: صرف اگر gclid, gbraid, یا wbraid موجود ہو
لنکڈ ان پکسل: صرف اگر msclkid موجود ہو
فیس بک پکسل: صرف اگر fbclid موجود ہو
فائدہ: صفحات کا تیز لوڈ ہونا، ٹریکنگ اوور ہیڈ کم ہونا
ٹریفک کے ماخذ کی شناخت
ہم URL پیرامیٹرز سے ٹریفک کا ماخذ پتہ لگاتے ہیں:
گوگل اشتہارات: gclid, gbraid, wbraid → utm_source=google_ads
گوگل نامیاتی: srsltid → utm_source=google_search
فیس بک: fbclid → utm_source=facebook
لنکڈ ان: msclkid → utm_source=linkedin
براہ راست: کوئی پیرامیٹر نہیں → utm_source=direct
تبدیلی (کنورژن) ٹریکنگ
ہم قیف کے ذریعے تبدیلیوں کو ٹریک کرتے ہیں:
مصنوعات دیکھنا → کارٹ میں شامل کرنا → چیک آؤٹ → خریداری
ہر قدم میں شامل ہے:
-
وزٹر آئی ڈی (منسوبیت کے لیے)
-
سیشن آئی ڈی (سیشن تجزیہ کے لیے)
-
مہم پیرامیٹرز (ROI حساب کے لیے)
-
پروڈکٹ SKU (مصنوعات کے تجزیہ کے لیے)
لیڈ ٹچ ٹریکنگ
جب صارف ہم سے رابطہ کرتے ہیں (واٹس ایپ، فون، ای میل)، تو ہم درج ذیل ریکارڈ کرتے ہیں:
رابطے کا طریقہ: واٹس ایپ، فون، ای میل
مہم پیرامیٹرز: کوکیز سے (30 منٹ کی ونڈو)
مصنوعات کا سیاق و سباق: وہ کس مصنوعات کے صفحے پر تھے
فائدہ: آف لائن تبدیلیوں کو آن لائن مہمات سے منسوب کرنا
ریٹ لیمٹنگ
تجزیاتی اینڈ پوائنٹ ریٹ لیمٹڈ ہے:
حد: فی IP 10 منٹ میں 100 درخواستیں
فائدہ: غلط استعمال اور بوٹ کی سیلاب سے بچاؤ
ذخیرہ کاری
ایونٹس S3 میں Kinesis Firehose کے ذریعے ذخیرہ ہوتے ہیں:
فارمیٹ: JSON لائنز (ایک ایونٹ فی لائن)
تقسیم: تاریخ کے حساب سے (سال/مہینہ/دن/گھنٹہ)
کمپریشن: Gzip
برقراری: 90 دن
سوالات
ایونٹس AWS Athena کے ذریعے سوال کیے جاتے ہیں:
اسکیما: Glue Data Catalog میں تعریف شدہ
سوالات: S3 ڈیٹا پر SQL
استعمال کے معاملات: مہم ROI، مصنوعات کی مقبولیت، ٹریفک کے ماخذ
حوالہ جات
تکنیکی تصورات
-
ویب تجزیات - ویکیپیڈیا
-
ڈیزائن کے ذریعے رازداری - ویکیپیڈیا
AWS خدمات
-
Kinesis Firehose - AWS دستاویزات
-
Athena - AWS دستاویزات
متعلقہ مضامین
- ملٹی سرور آرکیٹیکچر - جہاں تجزیات چلتا ہے
خلاصہ
ہمارا تجزیاتی نظام رازداری کا احترام کرتے ہوئے صارف کے رویے کو ٹریک کرتا ہے:
کلائنٹ سائیڈ:
-
✅ URL سے مہم پیرامیٹرز نکالیں
-
✅ سیشن اسٹوریج میں محفوظ کریں (سیشن سکوپڈ)
-
✅ کوکیز میں محفوظ کریں (منسوبیت کے لیے 30 منٹ)
-
✅ ایونٹس API کو بھیجیں
سرور سائیڈ:
-
✅ جیوآئی پی اور یوزر ایجنٹ سے مزید معلومات فراہم کریں
-
✅ بوٹ ٹریفک فلٹر کریں
-
✅ Kinesis Firehose کو بھیجیں
-
✅ S3 میں محفوظ کریں (تاریخ کے حساب سے تقسیم شدہ)
رازداری:
-
✅ کوئی PII ذخیرہ نہیں
-
✅ گمنام IPs
-
✅ صرف فرسٹ پارٹی کوکیز
-
✅ آپٹ آؤٹ دستیاب
-
✅ 90 دن کی برقراری
مشروط لوڈنگ:
-
✅ گوگل اشتہارات پکسل صرف اگر gclid موجود ہو
-
✅ لنکڈ ان پکسل صرف اگر msclkid موجود ہو
-
✅ فیس بک پکسل صرف اگر fbclid موجود ہو
یہ نقطہ نظر بصیرت کو رازداری اور کارکردگی کے ساتھ متوازن کرتا ہے۔