ವಿಶ್ಲೇಷಣೆ ಟ್ರ್ಯಾಕಿಂಗ್: ಗೌಪ್ಯತೆ-ಮೊದಲ ಘಟನೆ ಸಂಗ್ರಹಣೆ
ಈ ಲೇಖನವು ಬಳಕೆದಾರರ ವರ್ತನೆಯನ್ನು ಗೌರವಿಸುವ ಮತ್ತು ಬಾಟ್ ಟ್ರಾಫಿಕ್ ತಪ್ಪಿಸುವಾಗ ನಾವು ಹೇಗೆ ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತೇವೆ ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತದೆ.
ಸಮಸ್ಯೆ: ಬಳಕೆದಾರರ ವರ್ತನೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು
ನಾವು ತಿಳಿದುಕೊಳ್ಳಬೇಕು:
-
ಬಳಕೆದಾರರು ಯಾವ ಪುಟಗಳನ್ನು ಭೇಟಿ ಮಾಡುತ್ತಾರೆ
-
ಅವರು ಯಾವ ಉತ್ಪನ್ನಗಳನ್ನು ನೋಡುತ್ತಾರೆ
-
ಟ್ರಾಫಿಕ್ ಎಲ್ಲಿಂದ ಬರುತ್ತದೆ (ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳು, ಸಾವಯವ, ಸಾಮಾಜಿಕ)
-
ಯಾವ ಪ್ರಚಾರಗಳು ಪರಿವರ್ತನೆಗಳನ್ನು ಚಾಲನೆ ಮಾಡುತ್ತವೆ
ಆದರೆ ನಾವು ತಪ್ಪಿಸಬೇಕು:
-
ಬಾಟ್ಗಳು ಮತ್ತು ಕ್ರಾಲರ್ಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುವುದು
-
ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸಬಹುದಾದ ಮಾಹಿತಿಯನ್ನು (PII) ಸಂಗ್ರಹಿಸುವುದು
-
ಗೌಪ್ಯತೆ ನಿಯಮಗಳನ್ನು ಉಲ್ಲಂಘಿಸುವುದು
ಪರಿಹಾರ: ಕ್ಲೈಂಟ್-ಸೈಡ್ + ಸರ್ವರ್-ಸೈಡ್ ಟ್ರ್ಯಾಕಿಂಗ್
ಕ್ಲೈಂಟ್-ಸೈಡ್: ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್ ಟ್ರ್ಯಾಕಿಂಗ್
ವಿಜಿಟರ್ ಐಡಿ: ಕುಕೀನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾದ ಯಾದೃಚ್ಛಿಕ ಐಡಿ (365 ದಿನಗಳು)
ಸೆಷನ್ ಐಡಿ: ಸೆಷನ್ ಸ್ಟೋರೇಜ್ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾದ ಯಾದೃಚ್ಛಿಕ ಐಡಿ (ಬ್ರೌಸರ್ ಮುಚ್ಚುವವರೆಗೆ)
ಪ್ರಚಾರ ಪ್ಯಾರಾಮೀಟರ್ಗಳು: URL ನಿಂದ ಹೊರತೆಗೆಯಲಾಗಿದೆ ಮತ್ತು ಸೆಷನ್ ಸ್ಟೋರೇಜ್ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ
ಟ್ರ್ಯಾಕ್ ಮಾಡಲಾದ ಪ್ಯಾರಾಮೀಟರ್ಗಳು:
-
gclid- ಗೂಗಲ್ ಕ್ಲಿಕ್ ಐಡಿ (ಶೋಧ ಜಾಹೀರಾತುಗಳು) -
gbraid- ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳ ಕ್ಲಿಕ್ ಐಡಿ (ಶಾಪಿಂಗ್ ಜಾಹೀರಾತುಗಳು) -
wbraid- ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳ ಕ್ಲಿಕ್ ಐಡಿ (iOS) -
fbclid- ಫೇಸ್ಬುಕ್ ಕ್ಲಿಕ್ ಐಡಿ -
srsltid- ಗೂಗಲ್ ಸಾವಯವ ಶೋಧ ಫಲಿತಾಂಶ ಐಡಿ -
utm_source,utm_medium,utm_campaign,utm_term,utm_content
ಸಂಗ್ರಹಣೆ: ವಾಟ್ಸಾಪ್/ಫೋನ್ ಕ್ಲಿಕ್ ಆರೋಪಣೆಗಾಗಿ ಪ್ಯಾರಾಮೀಟರ್ಗಳನ್ನು ಕುಕೀಗಳಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ (30 ನಿಮಿಷಗಳು)
ಸರ್ವರ್-ಸೈಡ್: ಸಮೃದ್ಧೀಕರಣ
ಸರ್ವರ್ ಘಟನೆಗಳನ್ನು ಈ ಕೆಳಗಿನವುಗಳೊಂದಿಗೆ ಸಮೃದ್ಧಗೊಳಿಸುತ್ತದೆ:
ಜಿಯೋಐಪಿ ಡೇಟಾ: ಐಪಿ ವಿಳಾಸದಿಂದ ದೇಶ, ಪ್ರದೇಶ, ನಗರ
ಬಳಕೆದಾರ-ಏಜೆಂಟ್ ಪಾರ್ಸಿಂಗ್: ಬ್ರೌಸರ್, ಓಎಸ್, ಸಾಧನ ಪ್ರಕಾರ
ಟೈಮ್ಸ್ಟ್ಯಾಂಪ್: ಸರ್ವರ್ ಸಮಯ (UTC)
ಬಾಟ್ ಪತ್ತೆ: ತಿಳಿದಿರುವ ಬಾಟ್ ಬಳಕೆದಾರ-ಏಜೆಂಟ್ಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುತ್ತದೆ
ಘಟನೆಯ ಪ್ರಕಾರಗಳು
ಪುಟ ವೀಕ್ಷಣೆ: ಬಳಕೆದಾರರು ಪುಟವನ್ನು ಭೇಟಿ ಮಾಡುತ್ತಾರೆ
ಉತ್ಪನ್ನ ವೀಕ್ಷಣೆ: ಬಳಕೆದಾರರು ಉತ್ಪನ್ನ ಪುಟವನ್ನು ನೋಡುತ್ತಾರೆ
ಕಾರ್ಟ್ಗೆ ಸೇರಿಸಿ: ಬಳಕೆದಾರರು ಉತ್ಪನ್ನವನ್ನು ಕಾರ್ಟ್ಗೆ ಸೇರಿಸುತ್ತಾರೆ
ಚೆಕ್ಔಟ್: ಬಳಕೆದಾರರು ಚೆಕ್ಔಟ್ ಪ್ರಾರಂಭಿಸುತ್ತಾರೆ
ಖರೀದಿ: ಬಳಕೆದಾರರು ಖರೀದಿಯನ್ನು ಪೂರ್ಣಗೊಳಿಸುತ್ತಾರೆ
ವಾಟ್ಸಾಪ್ ಕ್ಲಿಕ್: ಬಳಕೆದಾರರು ವಾಟ್ಸಾಪ್ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡುತ್ತಾರೆ
ಫೋನ್ ಕ್ಲಿಕ್: ಬಳಕೆದಾರರು ಫೋನ್ ಸಂಖ್ಯೆಯನ್ನು ಕ್ಲಿಕ್ ಮಾಡುತ್ತಾರೆ
ಡೇಟಾ ಹರಿವು
sequenceDiagram
participant User
participant JS as JavaScript
participant API as /api/analytics
participant Firehose as Kinesis Firehose
participant S3
User->>JS: Visit page
JS->>JS: Extract URL params
(gclid, utm_*, etc.)
JS->>JS: Store in sessionStorage
JS->>API: POST event + params
API->>API: Enrich with GeoIP
API->>API: Parse User-Agent
API->>API: Filter bots
API->>Firehose: Send enriched event
Firehose->>S3: Store in analytics bucketಬಾಟ್ ಪತ್ತೆ
ನಾವು ಬಹು ಸಂಕೇತಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಬಾಟ್ ಟ್ರಾಫಿಕ್ ಅನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುತ್ತೇವೆ:
ಬಳಕೆದಾರ-ಏಜೆಂಟ್ ಮಾದರಿಗಳು: ತಿಳಿದಿರುವ ಬಾಟ್ ತಂತಿಗಳು (ಗೂಗಲ್ಬಾಟ್, ಬಿಂಗ್ಬಾಟ್, ಇತ್ಯಾದಿ.)
ವರ್ತನೆ ಮಾದರಿಗಳು: ತುಂಬಾ ವೇಗವಾಗಿ, ತುಂಬಾ ಹೆಚ್ಚು ವಿನಂತಿಗಳು
ಕಾಣೆಯಾದ ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್: ಬಾಟ್ಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಜೆಎಸ್ ಕಾರ್ಯಗತಗೊಳಿಸುವುದಿಲ್ಲ
ವಿನಾಯಿತಿ ಕುಕಿ: tv_exclude=true ಎಲ್ಲಾ ಟ್ರ್ಯಾಕಿಂಗ್ ನಿಲ್ಲಿಸುತ್ತದೆ
ಗೌಪ್ಯತೆ ರಕ್ಷಣೆ
PII ಇಲ್ಲ: ನಾವು ಎಂದಿಗೂ ಹೆಸರುಗಳು, ಇಮೇಲ್ಗಳು, ಫೋನ್ ಸಂಖ್ಯೆಗಳನ್ನು ಸಂಗ್ರಹಿಸುವುದಿಲ್ಲ
ಅನಾಮಧೇಯ ಐಪಿಗಳು: ಸಂಗ್ರಹಣೆಗೆ ಮುಂಚೆ ಕೊನೆಯ ಆಕ್ಟೆಟ್ ತೆಗೆದುಹಾಕಲಾಗಿದೆ
ಕ್ರಾಸ್-ಸೈಟ್ ಟ್ರ್ಯಾಕಿಂಗ್ ಇಲ್ಲ: ಕುಕೀಗಳು ಮೊದಲ-ಪಕ್ಷ ಮಾತ್ರ
ಆಪ್ಟ್-ಔಟ್: ಬಳಕೆದಾರರು ವಿನಾಯಿತಿ ಕುಕಿ ಹೊಂದಿಸಬಹುದು
ಡೇಟಾ ಧಾರಣ: ಘಟನೆಗಳು 90 ದಿನಗಳ ನಂತರ ಅಳಿಸಲ್ಪಡುತ್ತವೆ
ಷರತ್ತುಬದ್ಧ ಪಿಕ್ಸೆಲ್ ಲೋಡಿಂಗ್
ನಾವು ಸಂಬಂಧಿತವಾದಾಗ ಮಾತ್ರ ಟ್ರ್ಯಾಕಿಂಗ್ ಪಿಕ್ಸೆಲ್ಗಳನ್ನು ಲೋಡ್ ಮಾಡುತ್ತೇವೆ:
ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳ ಪಿಕ್ಸೆಲ್: gclid, gbraid, ಅಥವಾ wbraid ಇದ್ದರೆ ಮಾತ್ರ
ಲಿಂಕ್ಡ್ಇನ್ ಪಿಕ್ಸೆಲ್: msclkid ಇದ್ದರೆ ಮಾತ್ರ
ಫೇಸ್ಬುಕ್ ಪಿಕ್ಸೆಲ್: fbclid ಇದ್ದರೆ ಮಾತ್ರ
ಲಾಭ: ವೇಗವಾದ ಪುಟ ಲೋಡ್ಗಳು, ಕಡಿಮೆ ಟ್ರ್ಯಾಕಿಂಗ್ ಓವರ್ಹೆಡ್
ಟ್ರಾಫಿಕ್ ಮೂಲ ಪತ್ತೆ
ನಾವು URL ಪ್ಯಾರಾಮೀಟರ್ಗಳಿಂದ ಟ್ರಾಫಿಕ್ ಮೂಲವನ್ನು ಪತ್ತೆ ಮಾಡುತ್ತೇವೆ:
ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳು: gclid, gbraid, wbraid → utm_source=google_ads
ಗೂಗಲ್ ಸಾವಯವ: srsltid → utm_source=google_search
ಫೇಸ್ಬುಕ್: fbclid → utm_source=facebook
ಲಿಂಕ್ಡ್ಇನ್: msclkid → utm_source=linkedin
ನೇರ: ಪ್ಯಾರಾಮೀಟರ್ಗಳಿಲ್ಲ → utm_source=direct
ಪರಿವರ್ತನೆ ಟ್ರ್ಯಾಕಿಂಗ್
ನಾವು ಫನೆಲ್ ಮೂಲಕ ಪರಿವರ್ತನೆಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತೇವೆ:
ಉತ್ಪನ್ನ ವೀಕ್ಷಣೆ → ಕಾರ್ಟ್ಗೆ ಸೇರಿಸಿ → ಚೆಕ್ಔಟ್ → ಖರೀದಿ
ಪ್ರತಿ ಹಂತವು ಈ ಕೆಳಗಿನವುಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ:
-
ವಿಜಿಟರ್ ಐಡಿ (ಆರೋಪಣೆಗಾಗಿ)
-
ಸೆಷನ್ ಐಡಿ (ಸೆಷನ್ ವಿಶ್ಲೇಷಣೆಗಾಗಿ)
-
ಪ್ರಚಾರ ಪ್ಯಾರಾಮೀಟರ್ಗಳು (ROI ಲೆಕ್ಕಾಚಾರಕ್ಕಾಗಿ)
-
ಉತ್ಪನ್ನ SKU (ಉತ್ಪನ್ನ ವಿಶ್ಲೇಷಣೆಗಾಗಿ)
ಲೀಡ್ ಟಚ್ ಟ್ರ್ಯಾಕಿಂಗ್
ಬಳಕೆದಾರರು ನಮ್ಮನ್ನು ಸಂಪರ್ಕಿಸಿದಾಗ (ವಾಟ್ಸಾಪ್, ಫೋನ್, ಇಮೇಲ್), ನಾವು ಸೆರೆಹಿಡಿಯುತ್ತೇವೆ:
ಸಂಪರ್ಕ ವಿಧಾನ: ವಾಟ್ಸಾಪ್, ಫೋನ್, ಇಮೇಲ್
ಪ್ರಚಾರ ಪ್ಯಾರಾಮೀಟರ್ಗಳು: ಕುಕೀಗಳಿಂದ (30-ನಿಮಿಷ ವಿಂಡೋ)
ಉತ್ಪನ್ನ ಸಂದರ್ಭ: ಅವರು ಯಾವ ಉತ್ಪನ್ನ ಪುಟದಲ್ಲಿದ್ದರು
ಲಾಭ: ಆಫ್ಲೈನ್ ಪರಿವರ್ತನೆಗಳನ್ನು ಆನ್ಲೈನ್ ಪ್ರಚಾರಗಳಿಗೆ ಆರೋಪಿಸಿ
ದರ ಮಿತಿಗೊಳಿಸುವಿಕೆ
ವಿಶ್ಲೇಷಣಾ ಎಂಡ್ಪಾಯಿಂಟ್ ದರ-ಮಿತಿಗೊಳಿಸಲಾಗಿದೆ:
ಮಿತಿ: ಪ್ರತಿ ಐಪಿಗೆ 10 ನಿಮಿಷಗಳಿಗೆ 100 ವಿನಂತಿಗಳು
ಲಾಭ: ದುರುಪಯೋಗ ಮತ್ತು ಬಾಟ್ ಪ್ರವಾಹವನ್ನು ತಡೆಯುತ್ತದೆ
ಸಂಗ್ರಹಣೆ
ಘಟನೆಗಳನ್ನು ಕಿನೆಸಿಸ್ ಫೈರ್ಹೋಸ್ ಮೂಲಕ S3 ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ:
ಫಾರ್ಮ್ಯಾಟ್: JSON ಸಾಲುಗಳು (ಪ್ರತಿ ಸಾಲಿಗೆ ಒಂದು ಘಟನೆ)
ವಿಭಜನೆ: ದಿನಾಂಕದಿಂದ (ವರ್ಷ/ತಿಂಗಳು/ದಿನ/ಗಂಟೆ)
ಸಂಪೀಡನ: Gzip
ಧಾರಣ: 90 ದಿನಗಳು
ಪ್ರಶ್ನಿಸುವಿಕೆ
ಘಟನೆಗಳನ್ನು AWS ಅಥೆನಾ ಮೂಲಕ ಪ್ರಶ್ನಿಸಲಾಗುತ್ತದೆ:
ಸ್ಕೀಮಾ: ಗ್ಲೂ ಡೇಟಾ ಕ್ಯಾಟಲಾಗ್ನಲ್ಲಿ ವ್ಯಾಖ್ಯಾನಿಸಲಾಗಿದೆ
ಪ್ರಶ್ನೆಗಳು: S3 ಡೇಟಾದಲ್ಲಿ SQL
ಬಳಕೆಯ ಪ್ರಕರಣಗಳು: ಪ್ರಚಾರ ROI, ಉತ್ಪನ್ನ ಜನಪ್ರಿಯತೆ, ಟ್ರಾಫಿಕ್ ಮೂಲಗಳು
ಉಲ್ಲೇಖಗಳು
ತಾಂತ್ರಿಕ ಪರಿಕಲ್ಪನೆಗಳು
-
ವೆಬ್ ವಿಶ್ಲೇಷಣೆ - ವಿಕಿಪೀಡಿಯಾ
-
ರೂಪರೇಖೆಯಿಂದ ಗೌಪ್ಯತೆ - ವಿಕಿಪೀಡಿಯಾ
AWS ಸೇವೆಗಳು
-
ಕಿನೆಸಿಸ್ ಫೈರ್ಹೋಸ್ - AWS ದಸ್ತಾವೇಜು
-
ಅಥೆನಾ - AWS ದಸ್ತಾವೇಜು
ಸಂಬಂಧಿತ ಲೇಖನಗಳು
- ಮಲ್ಟಿ-ಸರ್ವರ್ ಆರ್ಕಿಟೆಕ್ಚರ್ - ವಿಶ್ಲೇಷಣೆ ಎಲ್ಲಿ ಚಲಿಸುತ್ತದೆ
ಸಾರಾಂಶ
ನಮ್ಮ ವಿಶ್ಲೇಷಣಾ ವ್ಯವಸ್ಥೆಯು ಬಳಕೆದಾರರ ವರ್ತನೆಯನ್ನು ಗೌಪ್ಯತೆಯನ್ನು ಗೌರವಿಸುವಾಗ ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತದೆ:
ಕ್ಲೈಂಟ್-ಸೈಡ್:
-
✅ URL ನಿಂದ ಪ್ರಚಾರ ಪ್ಯಾರಾಮೀಟರ್ಗಳನ್ನು ಹೊರತೆಗೆಯಿರಿ
-
✅ ಸೆಷನ್ ಸ್ಟೋರೇಜ್ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಿ (ಸೆಷನ್-ಸ್ಕೋಪ್ಡ್)
-
✅ ಕುಕೀಗಳಲ್ಲಿ ಸಂಗ್ರಹಿಸಿ (ಆರೋಪಣೆಗಾಗಿ 30 ನಿಮಿಷ)
-
✅ API ಗೆ ಘಟನೆಗಳನ್ನು ಕಳುಹಿಸಿ
ಸರ್ವರ್-ಸೈಡ್:
- ✅ ಜಿಯೋಐಪಿ ಮತ್ತು ಬಳಕೆದಾರ-