SEO-Pipeline

Dieser Artikel erklärt, wie Thinvent Abfrageseiten aus Suchdaten generiert. Unsere SEO-Pipeline verarbeitet Abfragen aus mehreren Quellen, gruppiert sie, ordnet sie Produkten zu und generiert optimierte Seiten für Suchmaschinen.

Datenquellen

Wir aggregieren Abfragen aus mehreren Quellen:

Google Search Console (GSC): Organische Suchanfragen mit Impressionen und Klicks
Google Ads: Suchbegriffe, die bezahlte Anzeigen ausgelöst haben
Google Ads Keyword-Ideen: Keyword-Vorschläge mit Suchvolumen
Live-Abfragen: Echtzeit-Suchanfragen von unserem Suchdienst

Diese Quellen bieten einen umfassenden Überblick darüber, wonach Nutzer suchen, und kombinieren historische Daten mit Echtzeit-Einblicken.

Pipeline-Architektur

Die SEO-Pipeline läuft wöchentlich sonntags und besteht aus 11 Schritten:

flowchart TD
    A[Step 0: Embed Source Data] --> B[Step 1a: Fetch GSC]
    A --> C[Step 1b: Fetch Ads]
    A --> D[Step 1c: Fetch Keywords]
    A --> E[Step 1d: Fetch Live]
    
    B --> G[Step 2: Combine Queries]
    C --> G
    D --> G
    E --> G
    
    G --> H[Step 3a: Generate Base Phrases]
    G --> I[Step 3b: Embed Queries]
    
    H --> J[Step 4: Expand Phrase Mappings]
    I --> J
    
    J --> K[Step 5: Cluster Queries]
    I --> K
    
    K --> L[Step 6: Match Source Data]
    A --> L
    
    L --> M[Step 7: Route Queries]
    J --> M
    K --> M
    
    M --> N[Step 8a: Build Query Pages]
    K --> O[Step 8b: Generate Related Searches]
    
    N --> O[Step 8b: Generate Related Searches]

Schritt-für-Schritt-Prozess

Schritt 0: Einbetten von Quelldaten

Wir betten Produktdaten mit SentenceTransformer ein, um semantische Embeddings zu erstellen. Diese Embeddings werden später verwendet, um Abfragen basierend auf semantischer Ähnlichkeit und nicht nur auf Keyword-Übereinstimmung Produkten zuzuordnen.

Schritte 1a-1e: Abfragen abrufen

Wir holen Abfragen aus mehreren Quellen:

Google Search Console (GSC): Organische Suchanfragen mit Leistungsmetriken
Google Ads: Suchbegriffe, die bezahlte Anzeigen ausgelöst haben
Google Ads Keyword-Ideen: Keyword-Vorschläge mit Suchvolumen
Live-Abfragen: Echtzeit-Suchanfragen von unserem Suchdienst

Jede Quelle bietet unterschiedliche Einblicke in die Nutzerabsicht.

Schritt 2: Abfragen kombinieren

Wir kombinieren alle Abfragen in einen einzigen Datensatz, entfernen Duplikate und aggregieren Metriken wie Impressionen und Klicks.

Schritte 3a-3b: Phrasen generieren und einbetten

Wir generieren Basisphrasen aus Produkteigenschaften und betten Abfragen mit SentenceTransformer ein. Die Phrasenzuordnungen werden verwendet, um Filter aus Suchanfragen zu extrahieren.

Schritt 4: Phrasenzuordnungen erweitern

Wir erweitern die Phrasenzuordnungen durch:

Auflösen von Speicher-/Speicherkollisionen (z.B. "8GB RAM" vs. "8GB Speicher")
Aufbauen von Phrase-zu-Filter-Zuordnungen
Extrahieren von N-Grammen aus Abfragen

Schritt 5: Abfragen clustern

Wir clustern ähnliche Abfragen mithilfe von Vektorähnlichkeit. Semantisch ähnliche Abfragen werden zusammengefasst und teilen sich dieselbe Abfrageseite.

Schritt 6: Quelldaten zuordnen

Wir ordnen Abfragen Produkten zu mithilfe von:

Vektorähnlichkeit zwischen Abfrage-Embeddings und Produkt-Embeddings
Filterextraktion aus Phrasenzuordnungen
Übereinstimmung von Produktnamen

Schritt 7: Abfragen weiterleiten

Wir leiten Abfragen an geeignete Seiten weiter:

Finden von Familienübereinstimmungen (z.B. "Treo"-Familie)
Finden von Kategorieübereinstimmungen (z.B. "Mini-PC"-Kategorie)
Generieren von Slugs für Abfrageseiten

Schritte 8a-8b: Seiten und verwandte Suchen erstellen

Wir erstellen Abfrageseiten und generieren verwandte Suchen:

Schritt 8a: Abfrageseiten mit Produktlisten erstellen
Schritt 8b: Verwandte Suchen mithilfe von Vektorähnlichkeit generieren

Generierung von Abfrageseiten

Abfrageseiten werden unter /q/<slug> generiert und enthalten:

Titel: Für Suchmaschinen optimiert
Beschreibung: KI-generierter Inhalt
Produkte: Top passende Produkte
Filter: Aus der Abfrage extrahiert
Verwandte Suchen: Übereinstimmungen basierend auf semantischer Ähnlichkeit

KI-Inhaltsgenerierung

Wir nutzen KI, um Inhalte für Abfrageseiten zu generieren:

DeepSeek: Produktbeschreibungen, Abfrageseiten-Inhalte
System-Prompts: Für Caching-Effizienz
Temperatur: 0,7 für ausgewogene Kreativität

Die KI generiert:

Tagline: Kurze, ansprechende Überschrift
Haupttext: Detaillierte Produktinformationen

Mehrsprachige Unterstützung

Abfrageseiten unterstützen mehrere Sprachen:

Englisch (Quelle)
Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch
Russisch, Hindi, Bengalisch, Gujarati, Kannada
Malayalam, Marathi, Punjabi, Tamil, Telugu
Arabisch, Chinesisch, Japanisch, Koreanisch

Zusammenfassung

Unsere SEO-Pipeline bietet:

Umfassende Daten: Mehrere Abfragequellen
Semantische Zuordnung: Vektorähnlichkeit für bessere Übereinstimmungen
KI-Inhalte: Automatisierte Inhaltsgenerierung
Mehrsprachig: Unterstützung für 15+ Sprachen
Automatisiert: Wöchentliche Pipeline mit Kontrollpunkten

Prodotti

Ricerche e Blog popolari