ವಿಶ್ಲೇಷಣೆ ಟ್ರ್ಯಾಕಿಂಗ್: ಗೌಪ್ಯತೆ-ಮೊದಲ ಘಟನೆ ಸಂಗ್ರಹಣೆ

ಈ ಲೇಖನವು ಬಳಕೆದಾರರ ವರ್ತನೆಯನ್ನು ಗೌರವಿಸುವ ಮತ್ತು ಬಾಟ್ ಟ್ರಾಫಿಕ್ ತಪ್ಪಿಸುವಾಗ ನಾವು ಹೇಗೆ ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತೇವೆ ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತದೆ.

ಸಮಸ್ಯೆ: ಬಳಕೆದಾರರ ವರ್ತನೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು

ನಾವು ತಿಳಿದುಕೊಳ್ಳಬೇಕು:

  • ಬಳಕೆದಾರರು ಯಾವ ಪುಟಗಳನ್ನು ಭೇಟಿ ಮಾಡುತ್ತಾರೆ

  • ಅವರು ಯಾವ ಉತ್ಪನ್ನಗಳನ್ನು ನೋಡುತ್ತಾರೆ

  • ಟ್ರಾಫಿಕ್ ಎಲ್ಲಿಂದ ಬರುತ್ತದೆ (ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳು, ಸಾವಯವ, ಸಾಮಾಜಿಕ)

  • ಯಾವ ಪ್ರಚಾರಗಳು ಪರಿವರ್ತನೆಗಳನ್ನು ಚಾಲನೆ ಮಾಡುತ್ತವೆ

ಆದರೆ ನಾವು ತಪ್ಪಿಸಬೇಕು:

  • ಬಾಟ್ಗಳು ಮತ್ತು ಕ್ರಾಲರ್ಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುವುದು

  • ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸಬಹುದಾದ ಮಾಹಿತಿಯನ್ನು (PII) ಸಂಗ್ರಹಿಸುವುದು

  • ಗೌಪ್ಯತೆ ನಿಯಮಗಳನ್ನು ಉಲ್ಲಂಘಿಸುವುದು

ಪರಿಹಾರ: ಕ್ಲೈಂಟ್-ಸೈಡ್ + ಸರ್ವರ್-ಸೈಡ್ ಟ್ರ್ಯಾಕಿಂಗ್

ಕ್ಲೈಂಟ್-ಸೈಡ್: ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್ ಟ್ರ್ಯಾಕಿಂಗ್

ವಿಜಿಟರ್ ಐಡಿ: ಕುಕೀನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾದ ಯಾದೃಚ್ಛಿಕ ಐಡಿ (365 ದಿನಗಳು)

ಸೆಷನ್ ಐಡಿ: ಸೆಷನ್ ಸ್ಟೋರೇಜ್ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾದ ಯಾದೃಚ್ಛಿಕ ಐಡಿ (ಬ್ರೌಸರ್ ಮುಚ್ಚುವವರೆಗೆ)

ಪ್ರಚಾರ ಪ್ಯಾರಾಮೀಟರ್ಗಳು: URL ನಿಂದ ಹೊರತೆಗೆಯಲಾಗಿದೆ ಮತ್ತು ಸೆಷನ್ ಸ್ಟೋರೇಜ್ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ

ಟ್ರ್ಯಾಕ್ ಮಾಡಲಾದ ಪ್ಯಾರಾಮೀಟರ್ಗಳು:

  • gclid - ಗೂಗಲ್ ಕ್ಲಿಕ್ ಐಡಿ (ಶೋಧ ಜಾಹೀರಾತುಗಳು)

  • gbraid - ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳ ಕ್ಲಿಕ್ ಐಡಿ (ಶಾಪಿಂಗ್ ಜಾಹೀರಾತುಗಳು)

  • wbraid - ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳ ಕ್ಲಿಕ್ ಐಡಿ (iOS)

  • fbclid - ಫೇಸ್ಬುಕ್ ಕ್ಲಿಕ್ ಐಡಿ

  • srsltid - ಗೂಗಲ್ ಸಾವಯವ ಶೋಧ ಫಲಿತಾಂಶ ಐಡಿ

  • utm_source, utm_medium, utm_campaign, utm_term, utm_content

ಸಂಗ್ರಹಣೆ: ವಾಟ್ಸಾಪ್/ಫೋನ್ ಕ್ಲಿಕ್ ಆರೋಪಣೆಗಾಗಿ ಪ್ಯಾರಾಮೀಟರ್ಗಳನ್ನು ಕುಕೀಗಳಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ (30 ನಿಮಿಷಗಳು)

ಸರ್ವರ್-ಸೈಡ್: ಸಮೃದ್ಧೀಕರಣ

ಸರ್ವರ್ ಘಟನೆಗಳನ್ನು ಈ ಕೆಳಗಿನವುಗಳೊಂದಿಗೆ ಸಮೃದ್ಧಗೊಳಿಸುತ್ತದೆ:

ಜಿಯೋಐಪಿ ಡೇಟಾ: ಐಪಿ ವಿಳಾಸದಿಂದ ದೇಶ, ಪ್ರದೇಶ, ನಗರ

ಬಳಕೆದಾರ-ಏಜೆಂಟ್ ಪಾರ್ಸಿಂಗ್: ಬ್ರೌಸರ್, ಓಎಸ್, ಸಾಧನ ಪ್ರಕಾರ

ಟೈಮ್ಸ್ಟ್ಯಾಂಪ್: ಸರ್ವರ್ ಸಮಯ (UTC)

ಬಾಟ್ ಪತ್ತೆ: ತಿಳಿದಿರುವ ಬಾಟ್ ಬಳಕೆದಾರ-ಏಜೆಂಟ್ಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುತ್ತದೆ

ಘಟನೆಯ ಪ್ರಕಾರಗಳು

ಪುಟ ವೀಕ್ಷಣೆ: ಬಳಕೆದಾರರು ಪುಟವನ್ನು ಭೇಟಿ ಮಾಡುತ್ತಾರೆ

ಉತ್ಪನ್ನ ವೀಕ್ಷಣೆ: ಬಳಕೆದಾರರು ಉತ್ಪನ್ನ ಪುಟವನ್ನು ನೋಡುತ್ತಾರೆ

ಕಾರ್ಟ್ಗೆ ಸೇರಿಸಿ: ಬಳಕೆದಾರರು ಉತ್ಪನ್ನವನ್ನು ಕಾರ್ಟ್ಗೆ ಸೇರಿಸುತ್ತಾರೆ

ಚೆಕ್ಔಟ್: ಬಳಕೆದಾರರು ಚೆಕ್ಔಟ್ ಪ್ರಾರಂಭಿಸುತ್ತಾರೆ

ಖರೀದಿ: ಬಳಕೆದಾರರು ಖರೀದಿಯನ್ನು ಪೂರ್ಣಗೊಳಿಸುತ್ತಾರೆ

ವಾಟ್ಸಾಪ್ ಕ್ಲಿಕ್: ಬಳಕೆದಾರರು ವಾಟ್ಸಾಪ್ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡುತ್ತಾರೆ

ಫೋನ್ ಕ್ಲಿಕ್: ಬಳಕೆದಾರರು ಫೋನ್ ಸಂಖ್ಯೆಯನ್ನು ಕ್ಲಿಕ್ ಮಾಡುತ್ತಾರೆ

ಡೇಟಾ ಹರಿವು

sequenceDiagram
    participant User
    participant JS as JavaScript
    participant API as /api/analytics
    participant Firehose as Kinesis Firehose
    participant S3
    
    User->>JS: Visit page
    JS->>JS: Extract URL params
(gclid, utm_*, etc.) JS->>JS: Store in sessionStorage JS->>API: POST event + params API->>API: Enrich with GeoIP API->>API: Parse User-Agent API->>API: Filter bots API->>Firehose: Send enriched event Firehose->>S3: Store in analytics bucket

ಬಾಟ್ ಪತ್ತೆ

ನಾವು ಬಹು ಸಂಕೇತಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಬಾಟ್ ಟ್ರಾಫಿಕ್ ಅನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುತ್ತೇವೆ:

ಬಳಕೆದಾರ-ಏಜೆಂಟ್ ಮಾದರಿಗಳು: ತಿಳಿದಿರುವ ಬಾಟ್ ತಂತಿಗಳು (ಗೂಗಲ್ಬಾಟ್, ಬಿಂಗ್ಬಾಟ್, ಇತ್ಯಾದಿ.)

ವರ್ತನೆ ಮಾದರಿಗಳು: ತುಂಬಾ ವೇಗವಾಗಿ, ತುಂಬಾ ಹೆಚ್ಚು ವಿನಂತಿಗಳು

ಕಾಣೆಯಾದ ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್: ಬಾಟ್ಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಜೆಎಸ್ ಕಾರ್ಯಗತಗೊಳಿಸುವುದಿಲ್ಲ

ವಿನಾಯಿತಿ ಕುಕಿ: tv_exclude=true ಎಲ್ಲಾ ಟ್ರ್ಯಾಕಿಂಗ್ ನಿಲ್ಲಿಸುತ್ತದೆ

ಗೌಪ್ಯತೆ ರಕ್ಷಣೆ

PII ಇಲ್ಲ: ನಾವು ಎಂದಿಗೂ ಹೆಸರುಗಳು, ಇಮೇಲ್ಗಳು, ಫೋನ್ ಸಂಖ್ಯೆಗಳನ್ನು ಸಂಗ್ರಹಿಸುವುದಿಲ್ಲ

ಅನಾಮಧೇಯ ಐಪಿಗಳು: ಸಂಗ್ರಹಣೆಗೆ ಮುಂಚೆ ಕೊನೆಯ ಆಕ್ಟೆಟ್ ತೆಗೆದುಹಾಕಲಾಗಿದೆ

ಕ್ರಾಸ್-ಸೈಟ್ ಟ್ರ್ಯಾಕಿಂಗ್ ಇಲ್ಲ: ಕುಕೀಗಳು ಮೊದಲ-ಪಕ್ಷ ಮಾತ್ರ

ಆಪ್ಟ್-ಔಟ್: ಬಳಕೆದಾರರು ವಿನಾಯಿತಿ ಕುಕಿ ಹೊಂದಿಸಬಹುದು

ಡೇಟಾ ಧಾರಣ: ಘಟನೆಗಳು 90 ದಿನಗಳ ನಂತರ ಅಳಿಸಲ್ಪಡುತ್ತವೆ

ಷರತ್ತುಬದ್ಧ ಪಿಕ್ಸೆಲ್ ಲೋಡಿಂಗ್

ನಾವು ಸಂಬಂಧಿತವಾದಾಗ ಮಾತ್ರ ಟ್ರ್ಯಾಕಿಂಗ್ ಪಿಕ್ಸೆಲ್ಗಳನ್ನು ಲೋಡ್ ಮಾಡುತ್ತೇವೆ:

ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳ ಪಿಕ್ಸೆಲ್: gclid, gbraid, ಅಥವಾ wbraid ಇದ್ದರೆ ಮಾತ್ರ

ಲಿಂಕ್ಡ್ಇನ್ ಪಿಕ್ಸೆಲ್: msclkid ಇದ್ದರೆ ಮಾತ್ರ

ಫೇಸ್ಬುಕ್ ಪಿಕ್ಸೆಲ್: fbclid ಇದ್ದರೆ ಮಾತ್ರ

ಲಾಭ: ವೇಗವಾದ ಪುಟ ಲೋಡ್ಗಳು, ಕಡಿಮೆ ಟ್ರ್ಯಾಕಿಂಗ್ ಓವರ್ಹೆಡ್

ಟ್ರಾಫಿಕ್ ಮೂಲ ಪತ್ತೆ

ನಾವು URL ಪ್ಯಾರಾಮೀಟರ್ಗಳಿಂದ ಟ್ರಾಫಿಕ್ ಮೂಲವನ್ನು ಪತ್ತೆ ಮಾಡುತ್ತೇವೆ:

ಗೂಗಲ್ ಜಾಹೀರಾತುಗಳು: gclid, gbraid, wbraidutm_source=google_ads

ಗೂಗಲ್ ಸಾವಯವ: srsltidutm_source=google_search

ಫೇಸ್ಬುಕ್: fbclidutm_source=facebook

ಲಿಂಕ್ಡ್ಇನ್: msclkidutm_source=linkedin

ನೇರ: ಪ್ಯಾರಾಮೀಟರ್ಗಳಿಲ್ಲ → utm_source=direct

ಪರಿವರ್ತನೆ ಟ್ರ್ಯಾಕಿಂಗ್

ನಾವು ಫನೆಲ್ ಮೂಲಕ ಪರಿವರ್ತನೆಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತೇವೆ:

ಉತ್ಪನ್ನ ವೀಕ್ಷಣೆಕಾರ್ಟ್ಗೆ ಸೇರಿಸಿಚೆಕ್ಔಟ್ಖರೀದಿ

ಪ್ರತಿ ಹಂತವು ಈ ಕೆಳಗಿನವುಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ:

  • ವಿಜಿಟರ್ ಐಡಿ (ಆರೋಪಣೆಗಾಗಿ)

  • ಸೆಷನ್ ಐಡಿ (ಸೆಷನ್ ವಿಶ್ಲೇಷಣೆಗಾಗಿ)

  • ಪ್ರಚಾರ ಪ್ಯಾರಾಮೀಟರ್ಗಳು (ROI ಲೆಕ್ಕಾಚಾರಕ್ಕಾಗಿ)

  • ಉತ್ಪನ್ನ SKU (ಉತ್ಪನ್ನ ವಿಶ್ಲೇಷಣೆಗಾಗಿ)

ಲೀಡ್ ಟಚ್ ಟ್ರ್ಯಾಕಿಂಗ್

ಬಳಕೆದಾರರು ನಮ್ಮನ್ನು ಸಂಪರ್ಕಿಸಿದಾಗ (ವಾಟ್ಸಾಪ್, ಫೋನ್, ಇಮೇಲ್), ನಾವು ಸೆರೆಹಿಡಿಯುತ್ತೇವೆ:

ಸಂಪರ್ಕ ವಿಧಾನ: ವಾಟ್ಸಾಪ್, ಫೋನ್, ಇಮೇಲ್

ಪ್ರಚಾರ ಪ್ಯಾರಾಮೀಟರ್ಗಳು: ಕುಕೀಗಳಿಂದ (30-ನಿಮಿಷ ವಿಂಡೋ)

ಉತ್ಪನ್ನ ಸಂದರ್ಭ: ಅವರು ಯಾವ ಉತ್ಪನ್ನ ಪುಟದಲ್ಲಿದ್ದರು

ಲಾಭ: ಆಫ್ಲೈನ್ ಪರಿವರ್ತನೆಗಳನ್ನು ಆನ್ಲೈನ್ ಪ್ರಚಾರಗಳಿಗೆ ಆರೋಪಿಸಿ

ದರ ಮಿತಿಗೊಳಿಸುವಿಕೆ

ವಿಶ್ಲೇಷಣಾ ಎಂಡ್ಪಾಯಿಂಟ್ ದರ-ಮಿತಿಗೊಳಿಸಲಾಗಿದೆ:

ಮಿತಿ: ಪ್ರತಿ ಐಪಿಗೆ 10 ನಿಮಿಷಗಳಿಗೆ 100 ವಿನಂತಿಗಳು

ಲಾಭ: ದುರುಪಯೋಗ ಮತ್ತು ಬಾಟ್ ಪ್ರವಾಹವನ್ನು ತಡೆಯುತ್ತದೆ

ಸಂಗ್ರಹಣೆ

ಘಟನೆಗಳನ್ನು ಕಿನೆಸಿಸ್ ಫೈರ್ಹೋಸ್ ಮೂಲಕ S3 ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ:

ಫಾರ್ಮ್ಯಾಟ್: JSON ಸಾಲುಗಳು (ಪ್ರತಿ ಸಾಲಿಗೆ ಒಂದು ಘಟನೆ)

ವಿಭಜನೆ: ದಿನಾಂಕದಿಂದ (ವರ್ಷ/ತಿಂಗಳು/ದಿನ/ಗಂಟೆ)

ಸಂಪೀಡನ: Gzip

ಧಾರಣ: 90 ದಿನಗಳು

ಪ್ರಶ್ನಿಸುವಿಕೆ

ಘಟನೆಗಳನ್ನು AWS ಅಥೆನಾ ಮೂಲಕ ಪ್ರಶ್ನಿಸಲಾಗುತ್ತದೆ:

ಸ್ಕೀಮಾ: ಗ್ಲೂ ಡೇಟಾ ಕ್ಯಾಟಲಾಗ್ನಲ್ಲಿ ವ್ಯಾಖ್ಯಾನಿಸಲಾಗಿದೆ

ಪ್ರಶ್ನೆಗಳು: S3 ಡೇಟಾದಲ್ಲಿ SQL

ಬಳಕೆಯ ಪ್ರಕರಣಗಳು: ಪ್ರಚಾರ ROI, ಉತ್ಪನ್ನ ಜನಪ್ರಿಯತೆ, ಟ್ರಾಫಿಕ್ ಮೂಲಗಳು

ಉಲ್ಲೇಖಗಳು

ತಾಂತ್ರಿಕ ಪರಿಕಲ್ಪನೆಗಳು

AWS ಸೇವೆಗಳು

ಸಂಬಂಧಿತ ಲೇಖನಗಳು

ಸಾರಾಂಶ

ನಮ್ಮ ವಿಶ್ಲೇಷಣಾ ವ್ಯವಸ್ಥೆಯು ಬಳಕೆದಾರರ ವರ್ತನೆಯನ್ನು ಗೌಪ್ಯತೆಯನ್ನು ಗೌರವಿಸುವಾಗ ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತದೆ:

ಕ್ಲೈಂಟ್-ಸೈಡ್:

  • ✅ URL ನಿಂದ ಪ್ರಚಾರ ಪ್ಯಾರಾಮೀಟರ್ಗಳನ್ನು ಹೊರತೆಗೆಯಿರಿ

  • ✅ ಸೆಷನ್ ಸ್ಟೋರೇಜ್ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಿ (ಸೆಷನ್-ಸ್ಕೋಪ್ಡ್)

  • ✅ ಕುಕೀಗಳಲ್ಲಿ ಸಂಗ್ರಹಿಸಿ (ಆರೋಪಣೆಗಾಗಿ 30 ನಿಮಿಷ)

  • ✅ API ಗೆ ಘಟನೆಗಳನ್ನು ಕಳುಹಿಸಿ

ಸರ್ವರ್-ಸೈಡ್:

  • ✅ ಜಿಯೋಐಪಿ ಮತ್ತು ಬಳಕೆದಾರ-