Als SEOs und in der Online-Marketing-Branche allgemein stehen wir stets vor dem Problem der unvollständigen Informationen. Bei unserer täglichen Arbeit bemühen wir uns, alle uns zur Verfügung stehenden Informationsquellen zu nutzen und zielführend einzusetzen. Wir greifen auf Tools zurück, werten historische Daten aus, tauschen uns untereinander aus und testen. Google selbst gibt uns mit den Webmaster Tools und mit Analytics wertvolle Instrumente an die Hand, die es uns ermöglichen, große Mengen an Informationen zu aggregieren und auszuwerten. Doch seit März vergangenen Jahres (in Deutschland, in den USA bereits vorher) nahm uns Google einen Teil dieser wertvollen Daten wieder weg. „Not provided“ tauchte in den Reportings von Google Analytics auf und war fortan fester Bestandteil dieser. In dem heutigen Artikel möchte ich auf die Problematik eingehen, die durch die verschlüsselte Suche entstanden ist und eine Methode vorstellen, hinter den Vorhang von „not provided“ zu schauen.
Wie kommt „not provided“ zustande?
Sobald User in einem der Google-Dienste eingeloggt sind, verwenden sie automatisch die verschlüsselte Suche (SSL= Secure Sockets Layer), zu erkennen am HTTPS. Das veranlasst Google dazu, das Bedürfnis der User nach Sicherheit und Privatsphäre zu respektieren und entsprechend keine Angaben über getätigte Suchbegriffe an die Zielseite zu übermitteln. Im Klartext: Die Informationen hat Google nach wie vor, gibt diese nur nicht weiter. Alles im Interesse der User, versteht sich. Die Summe dieser verschlüsselten Suchvorgänge kennen wir als „not provided“ in Google Analytics. Für eine ausführliche und anschauliche Beschreibung des Funktionsprinzips der verschlüsselten Suche empfehle ich euch den Artikel „Die Sache mit SSL und Google“ von Dominik Wojcik.
„Not provided“ in Zahlen
Seit Einführung der verschlüsselten Suche wächst der Anteil des organischen Google-Traffics, bei dem das Keyword nicht übermittelt wird, kontinuierlich. Betrug der Anteil bei der Einführung noch wenig besorgniserregende 6-7 %, so macht er mittlerweile etwa einen Drittel des gesamten organischen Traffics über Google aus – schon eher besorgniserregend.
Schauen wir uns die Entwicklung der Zahlen der vergangenen Monate an, wird klar, dass das Ende der Fahnenstange noch lange nicht erreicht ist.
Warum sollte uns das interessieren?
Bei der Suchmaschinenoptimierung ist es elementar zu wissen, wie viel Traffic über welche Suchbegriffe generiert wird. Fehlt ein erheblicher Teil dieser Information, wird es schwierig, Potentiale zu erkennen, Keywords anhand des generierten Traffics zu bewerten oder gezielte Optimierungsmaßnahmen vorzunehmen. Wenn Analytics mir zeigt, dass 30 % meines Traffics über „not provided“ kommen, dann weiß ich nicht, ob es sich dabei um Brand Keywords oder Money Keywords handelt. Ich weiß nicht, ob es meine Top Keywords oder doch eher Keywords aus dem Longtail-Bereich sind. Sind es womöglich Keywords, die ich bis jetzt fälschlicherweise überhaupt nicht auf dem Schirm hatte, die aber in der Summe eine attraktive Traffic-Quelle darstellen? Viele Fragezeichen. Frustriert logge ich mich aus Analytics aus und fluche leise vor mich hin. Nein, ganz so schlimm ist es doch nicht. Es gibt einige Workarounds für das „not provided“-Problem, die durchaus vielversprechend sind. Einen smarten Ansatz möchte ich hier vorstellen.
Ein erster Ansatz
Die erste Annäherung an das Problem besteht darin, dass ich mir anschaue, welche Zielseiten wie viel „not provided“ Traffic abbekommen. Damit habe ich zumindest schon eine vage Vorstellung davon, um welche Keywords es sich dabei handelt. Denn im Idealfall habe ich all meine Seiten auf jeweils ein Haupt-Keyword optimiert und habe darüber hinaus sowieso einen guten Überblick darüber, für welche Keywords meine Seiten so gut ranken, dass sie Traffic generieren. Unter diesen Voraussetzungen und durch die Aufschlüsselung der „not provided“-Anteile auf die einzelnen Seiten weiß ich zwar immer noch nicht, welche Keywords sich exakt hinter „not provided“ verbergen, kann den Kreis der Verdächtigen aber schon recht gut eingrenzen und damit brauchbare Annahmen treffen. Und so lasse ich mir die „not provided“-Anteile auf Zielseitenebene anzeigen:
Zunächst erstelle ich ein erweitertes Segment und nenne es treffenderweise „Not Provided“.
Das Segment konfiguriere ich mit: „Einschließen“ > „Keyword“ > „enthält“ > „(not provided)„. Dann klicke ich nur noch auf „Segment speichern„, fertig.
Als Nächstes lasse ich mir den Report über den organischen Traffic anzeigen: „Besucherquellen“ > „Quellen“ > „Suche“ > „Organisch„. Nun bestimme ich noch als sekundäre Dimension über „Besucherquellen“ die Zielseiten. Als Ergebnis bekomme ich damit die Anzahl der Besuche einzelner Seiten über „not provided“.
Anmerkung: Natürlich muss ich für diese Informationen nicht zwingend ein benutzerdefiniertes Segment anlegen, ich kann mir die Darstellung der Keywords auf Zielseitenebene auch über die Standardfilter anzeigen lassen und auch explizit nach „not provided“ filtern. Die Lösung über ein speziell angelegtes Segment ist aber recht bequem und lässt sich schnell anwenden.
Der Trick mit den Filtern
Jetzt kommen wir zu dem spannenden Teil. Um dem Ganzen noch mehr Aussagekraft zu verleihen, lasse ich mir im nächsten Schritt über benutzerdefinierte Filter die Rankings der einzelnen Keywords anzeigen, über die ich Traffic bekomme. Glücklicherweise werden die Positionen der Keywords nämlich auch für „not provided“ angegeben.
Hinweis: Für die Einrichtung benutzerdefinierter Filter solltet ihr euch ein neues Profil anlegen, denn sonst lauft ihr Gefahr, eure Daten aus dem Standardprofil unwiederbringlich zu verlieren. Über „Verwaltung“ > „+ Neues Profil“ habt ihr ganz unkompliziert ein neues Profil erstellt. Jetzt nur noch einen treffenden Namen wählen und einen, zwei Tage warten, bis Daten erhoben werden.
Insgesamt definiere ich drei Filter. Neue Filter kann ich auf der Profilseite erstellen.
Der erste Filter legt als Kampagnenmedium „organic“ fest.
Der zweite Filter gibt „Google“ als Kampagnenquelle an.
Der dritte Filter ist schon etwas komplizierter und sorgt für das Auslesen der Keyword-Position aus dem Referrer. Dazu bediene ich mich folgender regulärer Ausdrücke (was ich mir im Übrigen nicht selbst zusammengereimt, sondern bei Yoast abgeguckt habe):
1. Feld: (.*)
2. Feld: (\?|&)cd=([^&]*)
3. Feld: $A1 (position: $B2)
Nachdem ich die Filter eingerichtet habe, bekomme ich – sobald erste Daten vorhanden sind – die Auflistung der „not provided“-Rankings. Dazu wähle ich über „Besucher“ > „Benutzerdefiniert“ > „Benutzerdefiniert“ den entsprechenden Bericht aus. Auch diese kann ich mir nun über die sekundäre Dimension – wie ich bereits beim ersten Ansatz gezeigt habe – für einzelne Zielseiten anschauen.
Schließlich kann ich die „not provided“-Rankings der einzelnen Seiten mit den Rankings der Keywords abgleichen, die ich habe. Bekomme ich beispielsweise auf einer bestimmten Unterseite Traffic über das Keyword XYZ auf Position 4 und habe gleichzeitig die Information, dass auch über ein „not-provided“-Keyword – ebenfalls auf Position 4 – Traffic generiert wird, handelt es sich sehr wahrscheinlich um ein und dasselbe Keyword. Je kleiner meine Seite ist und je weniger Rankings ich habe, desto klarer und eindeutiger kann ich solche Rückschlüsse ziehen. Bei großen Seiten ist es deutlich schwieriger, solche Zusammenhänge zu erkennen. Denn wenn ich auf einer Unterseite sehr viele Keywords mit identischem Ranking habe und auch das „not provided“-Ranking dasselbe ist, weiß ich nicht, zu welchem Keyword ich es zuordnen soll.
Fazit
Klar, die vorgestellte Methode stellt keine Wunderwaffe gegen das Problem der fehlenden Keyword-Daten dar. Doch lassen sich mit ihr schon recht gute Annahmen bzgl. der Keywords treffen, die mir Traffic bescheren.
Weitere interessante und hilfreiche Artikel zum Thema „not provided“:
- (not provided) Zugriffe in Google Analytics analysieren
- Super Advanced Not Provided Keywords Analysis in Google Analytics
Viel Spaß beim Ausprobieren wünschen euch
Andreas und die SEO Trainees
20 Antworten
Wo lege ich ein neues Profil an?
Danek für den Tipp. Hab mich schon gewundert, warum da ständig not provided steht 🙂 So kann man zumindest ein bisschen ableiten, um welche Keywords es sicht handelt.
was bedeutet es wenn statt „not provided“ für alle Keywords „not set“ da steht? Habe alle Filtereinstellungen nochmal überprüft, die stimmen alle. Es werden mir auch keine Postionen rausgegeben.
Natürlich alles im Interesse der User und nicht um uns armen SEOs das Leben schwer zu machen. Ich bin ja immer noch der Meinung das SEO normalerweise im Sinne von Google sein sollte. Sicher wird es zu oft dazu verwendet Spam nach oben zu bringen, aber was Google uns allein im letzten Jahr alles an den Kopf geworfen hat…
Danke für die geniale Anleitung. Das sich das so einfach per Filter in GA regeln lässt, war mir nicht klar 😉
Viele Grüße aus Innsbruck
Hi,
vielen Dank für den Beitrag. Ich hatte lange nach einer Lösung gesucht.
Die Filter funktioniert gut, aber leider habe ich in den Bericht komische Ergebnisse wie (not provided) (position: )
Warum ermittelt er bei manchen Ergebnissen keine Position?
Woran kann das liegen?
Hi Gökhan,
diese Beobachtung habe ich auch gemacht. Im Moment bin ich leider auch überfragt, woran das liegt, betrifft aber nicht nur die (not provided)-Angaben, sondern kommt auch bei angegebenen Keywords vor. Man könnte vielleicht die Keywords analysieren, die zwar angezeigt werden, zu denen aber kein Ranking ausgegeben wird. So kann man über Gemeinsamkeiten eventuell brauchbare Rückschlüsse ziehen.
Gruß
Andreas
Abend,
vielen Dank für den Beitrag. Den Ansatz finde ich echt nützlich. Vor ein paar Wochen habe ich mich über „not provided“ keywords auch schon geärgert. Und wenn deren Anteil 30% beträgt, ist es schon heftig… Bei der nächsten Gelegenheit teste ich es auch mal und schaue, ob die oben beschriebene Methode mich weiterbringt 🙂
Viele Grüße
Victoria
Hey Andreas,
erst einmal Danke für die Erwähnung hier.
Klar ist es nicht schön, dass dort die Daten nicht mehr auflaufen. Es passt aber meiner Meinung nach ganz gut dazu, dass sich SEO sowieso wandelt. Siehe den ersten Punkt dieser Infografik: http://bjoerntantau.com/wie-dramatisch-sich-seo-veraendert-hat-13122012.html
D. h. wir werden in Zukunft eine viel „User zentrierte“ Herangehensweise beim Betrieb von Webseiten wählen müssen ohne einzelne Keywords zu optimieren.
Viel wichtiger als einzelne Keywords zu bewerten wird es in Zukunft sein SEO in die Gesamtstrategie aus Social, SEA, UX, PR, Conversion Optimierung usw. zu integrieren und somit in den persönlichen Stream des Users zu gelangen anstatt mit Keywords XYZ auf Position 1 zu landen.
Viele Grüße
Mario
Hi Mario,
du hast natürlich recht mit der Prognose bzgl. der Entwicklung der Suchmaschinenoptimierung bzw. des Online Marketings insgesamt: alles wird immer stärker miteinander verwachsen und interagieren. Eine ganzheitliche Herangehensweise ist da schon von Vorteil. Aber auch für eine solche strategische Herangehensweise braucht man Daten/Informationen aus den einzelnen Bereichen, um diese zusammenzuführen. Ist dann einfach schade, wenn solche Daten fehlen und über Umwege zusammengereimt werden müssen.
Moin
und vielen Dank für die Aufklärung. Die 30% habe ich auch festgestellt. Aber wenn diese Personen eingeloggt sind, bedeutet das auch, dass diese (theoretisch) auch einen google+ account haben bzw. unkompliziert anlegen könnten. Da die Tendenz “Not provided” steigend ist, bedeutet das auch, dass immer mehr eingeloggt online sind (meistens wahrscheinlich unbewusst). Umso interessanter wird dann auch der google+ Button auf jeder Seite, der (wenn er genutzt wird) ein Rankingkriterium ist.
Somit eröffnen diese Erkenntnisse auch neue Möglichkeiten der SEO.
Viele Grüsse
Mathias
Guter Ansatz für kleinere Seiten. Entsprechende Mengen an Traffic vorausgesetzt kann das aber für größere Projekte auch funktionieren, man muss nur in den Vergleich noch mehr Parameter einbeziehen. Ähnliche Absprungraten oder ähnliche Conversions könnten auch ein Hinweis auf identische Keywords sein, wenn man sie zusätzlich zu Platzierung und Landingpage heranzieht. Man müsste dann in der Auswertung noch entsprechend clustern.
Es bleibt dann aber immer noch bei Annahmen, nicht bei sicheren Daten. (not provided) wird mir auch damit nicht sympathischer. 🙁
Hi Stefan,
Guter Punkt. Bei großen Seiten kann ich mir durchaus vorstellen, dass man weitere Parameter wie Absprungrate etc. einbezieht. Voraussetzung ist natürlich viel Traffic und damit eine Datenmenge, die groß genug ist, um einen gewissen Grad an Zuverlässigkeit zu gewährleisten.
Man sollte noch erwähnen das der Firefox Browser im Default https bei der Google Suche eingestellt hat. So viele Leute sind gar nicht eingeloggt, wie Google gerne hätte. Der ff macht einiges aus.
Danke, ich habe mich schon immer gefragt, wie ich mit „not provided“ vernünftig umgehen soll. Ich teste den Workaround und werde berichten.
Christian
Sehr interessanter Ansatz. Das nervt echt richtig und bei mir wird es auch immer mehr. Die neueste Version von Google Chrome feuert Suchanfragen ja auch per Standard über SSL raus.