Как декодировать Google Gclids

Теперь я понимаю, что первоначальным ответом на это, вероятно, будет «вы не можете» или «использовать аналитику», но я продолжу в надежде, что у кого-то больше понимания, чем это.

В Google AdWords с меткой «autotagging» добавляется «gclid» (предположительно «идентификатор клика Google»), чтобы перейти на рекламируемый сайт. Он появляется в веб-журнале, поскольку является параметром запроса, и он используется аналитиками, чтобы связать это посещение с рекламой / кампанией.

Я хотел бы извлечь любую полезную информацию из gclid, чтобы провести собственный анализ нашего трафика. Причины этого:

  • Статистика несовершенна, но если мы сопоставляем их, мы точно знаем, какие предположения мы сделали и как они были рассчитаны.
  • Мы можем связать данные с остальными нашими данными и получить гораздо более точную статистику по коэффициенту конверсии.
  • Нам не нужно полагаться на JavaScript для конверсий.

Теперь ясно, что gclid закодирован в base64 (или некотором близком варианте), и некоторые его части отличаются больше, чем другие. Кроме того, я не смог определить, к чему это относится.

Кто-нибудь знает, как я могу подойти к расшифровке этого, или кто-нибудь уже связал gclids с кампаниями или даже аккаунтами?

Я разговаривал с парой людей в Google, и, несмотря на их девиз «не будь злым», они совершенно не хотели обсуждать возможность разглашения этой информации даже в рамках NDA. Кажется, им нравится монополия на нашу веб-статистику.

хотя, это выглядит не связанный комментарий, но, пожалуйста, позвольте это. Девиз Google в Adword - «будь злым». Google сосет все деньги владельца малого и среднего бизнеса, как кровавого вампира.
Mani 12.05.2016 07:54:07
Существует такое объяснение: deedpolloffice.com/blog/articles/decoding-gclid-parameter
bastien 23.03.2017 14:28:37
11 ОТВЕТОВ

Ну, это не ответ, но подход похож на то, как вы решите любую проблему с криптографией.

Возможность 1: они просто случайные, в этом случае вы облажались. Это аналог одноразовой накладки.

Возможность 2: они «что-то значат». В этом случае вы должны контролировать окружающую среду.

  1. Получить хорошую базу данных о них. Найти gclids для вашего сайта и другие. Запишите все случаи, когда произошли все клики, и любые другие потенциально полезные данные.
  2. Взломать! Как вы уже начали, начните регрессировать собранные данные с вашими известными, и посмотрите, можете ли вы найти шаблоны, использующие методы расшифровки
  3. Начните собирать случайные gclid'ы и посмотрите, куда они вас приведут.

Я бы не надеялся, что это будет успешным, но я желаю вам удачи!

1
13.12.2008 23:08:14
Re 1 - Я почти уверен, что они не случайны. Наши gclids похожи, другие люди похожи, но не похожи на наши. Они определенно не простой инкрементный идентификатор. 2.1 - Это сложно, так как есть много gclids, которые вы не видите (если они не нажимают на них). ...
Draemon 13.12.2008 23:11:38
... Я собрал большой список из журналов, и я определил, какие байты меняются больше, чем другие, и мой мозг кричит «это не случайно», но кроме этого ничего никуда не привело. 2.2 / 2.3 - Я бы хотел получить ссылку на любые техники или инструменты - инстинкт не дал мне слишком далеко.
Draemon 13.12.2008 23:14:01
Я тоже не очень надеюсь, но это было бы очень круто - и я действительно не думаю, что это то, что Google должен иметь монополию. Я просто чувствую, что это «легко, если знаешь, как»
Draemon 13.12.2008 23:15:13
В blog.merjis.com/2007/07/16/click-fraud-google-adwords-and-gclid, похоже, много обсуждается роль gclid, и поиск в Google, кажется, дает много базовых знаний. Они новы для меня, чтобы я совал, если узнаю больше.
Gregg Lind 14.12.2008 15:39:29
Поскольку Google Analytics может понимать gclid, это, скорее всего, двусторонний хэш, что является плюсом. Работать по referrer_id.
Gregg Lind 14.12.2008 15:52:38

Безусловно, самое простое решение - вручную пометить ваши ссылки параметрами отслеживания кампании Google Analytics (utm_source, utm_campaign, utm_medium и т. Д.), А затем извлечь эти данные.

Gclid зависит не только от учетной записи AdWords / кампании / и т. Д. Если вы дважды нажмете на одно и то же объявление AdWords, оно может дать вам разные gclids, потому что с этим конкретным кликом также связаны все виды данных о сессиях и затратах.

Gclid, вероятно, не на 100% случайный, правда, но я был бы очень удивлен и обеспокоен, если бы было возможно извлечь все ваши данные Adwords из этого числа. Это будет ОГРОМНЫЙ недостаток безопасности (т. Е. Произвольный пользователь может просматривать ваши данные AdWords). Скорее всего, псевдослучайный gclid создается с каждым показом, и если на это объявление нажимают, gclid регистрируется в Adwords (в ​​противном случае он выбрасывается). Затем Google Analytics использует это число для сверки данных с Adwords после факта. Кроме этого, нет никакого внутреннего значения в самом числе gclid.

Что касается вашего последнего замечания, попытка взломать или перепроектировать эту информацию явно запрещена как в Условиях предоставления услуг Google Analytics, так и в Google Adwords, и является основанием для постоянного бана. Кроме того, в TOS, с которым вы согласились при подписке на эти услуги, говорится, что вы не можете использовать ваши данные так, как вам хочется. Google предоставляет бесплатный сервис, поэтому есть строки. Если вам не нравится полный контроль над вашими данными, то есть множество других решений. Тем не менее, вы будете платить за такой контроль.

Google зарабатывает почти все свои деньги от продажи рекламы. Adwords является их крупнейшим продуктом для зарабатывания денег. Они не собираются давать вам конфиденциальную информацию о том, как это работает. Они не знают, кто вы, или что вы собираетесь делать с этой информацией. Неважно, если вы подпишете соглашение о неразглашении, и у них есть право обратиться к вам в суд; если вы передадите эту информацию конкуренту, ваша жизнь не будет достаточной для того, чтобы вернуть деньги, которые вы потеряли.

Извините, что сломал это вам, но «Не будь злым» или нет, Google - это бизнес, а не благотворительность. Они не стали одной из самых успешных компаний в мире, отдав свой алгоритм поиска первому парню, который попросил об этом.

23
16.02.2009 21:06:49

К вашему сведению, я только что опубликовал краткий анализ некоторых данных glcid с моих сайтов в этом посте . В gclid определенно есть какая-то структура, но ее трудно расшифровать.

8
20.04.2009 22:30:22
Спасибо за информацию - приятно знать, что кому-то еще интересно! Вам действительно нужно декодировать символы, прежде чем искать шаблоны, поскольку base64 будет распространять исходные байты по смежным кодированным байтам. Я сам провел аналогичный анализ и точно так же убедил себя, что есть какая-то модель, но понятия не имею, что.
Draemon 20.04.2009 22:32:06
Анализ персонажей очень интересен и, по сути, доказывает, что есть данные, закодированные в этих gclids ... очень круто.
ojrac 19.08.2009 19:26:16

Другой подход состоит в том, чтобы просто посмотреть на данные реферера, которые, по крайней мере, предоставят ключевое слово, по которому был произведен поиск.

0
22.12.2009 18:41:06
Данные реферера отправляются клиентом (пользовательским агентом) и ненадежны.
Draemon 29.12.2009 00:31:31

Я согласен с Офиром и Крисом. Мне кажется, что это чисто серийный номер / уникальный идентификатор клика, который раскрывает свои секреты только тогда, когда системы Analytics и Adwords общаются друг с другом за кулисами.

Зная это, я бы порекомендовал взглянуть на ссылающийся URL-адрес и извлечь из него как можно больше информации, чтобы использовать его в настройке отслеживания кликов на сервере.

Например, я живу в Новой Зеландии и использую Firefox. Это поиск на панели инструментов Firefox Google для «переполнения стека»: http://www.google.co.nz/search?q=stack+overflow&ie=utf-8&oe=utf-8&aq=t&client=firefox-a&rlz=1R1GGLL_en -GB

Вы можете видеть, что: а) я использую домен .NZ, б) мое ключевое слово «стек + переполнение», в) я использую Firefox.

Наконец, если вы также храните полный URL-адрес целевой страницы, вы можете сохранить GCLID, который сообщит вам, что посетитель пришел из платного, тогда как если у него нет GCLID, то пользователь должен был прийти из обычного поиска (если URL-адрес пометка включена конечно).

Это теоретически позволит вам затем найти ключевое слово в вашей кампании и выяснить, из какой группы объявлений они были получены. Знать креатив, возможно, будет невозможно, если только вы не разделите тестирование своих целевых URL или не пометите их как-нибудь.

-1
13.01.2010 21:25:56
согласился, что если gclid был действительно непрозрачной ссылкой, это конец. Однако я уверен, что у него есть какая-то структура. То, что у меня было мало информации от Google, казалось, подразумевало это.
Draemon 13.01.2010 23:33:51

Я работал над этой проблемой и в нашей компании. Нам бы хотелось лучше понять, что делают наши AdWords, но мы разочарованы ограничениями в Google Analytics.

Наше текущее решение - искать в журналах доступа Apache запросы GET, используя регулярное выражение:

.*[?&]gclid=([^$&]*)

Если это существует, то мы смотрим на строку referer, чтобы получить ключевое слово:

.*[?&]q=([^$&]*).*

Альтернативный вариант - изменить ваш веб-журнал Apache, чтобы начать регистрировать cookie-файл __utmz, который устанавливает Google, и в нем должно быть фрагмент для ключевого слова в utmctr. Google __utmz cookie, и вы сможете найти много информации.

Насколько точна строка реферера? Не 100%. Брандмауэры и устройства безопасности уберут это. Но разбирая его самостоятельно, вы получаете больше гибкости, чем Google Analytics. Было бы отличной возможностью отправлять gclid в AdWords и возвращать данные, но эта функция не выглядит доступной.

РЕДАКТИРОВАТЬ: так как я написал это, мы также создали наши собственные теги, которые добавляются к каждому URL назначения в качестве параметра запроса. Каждый тег - это просто хэш md5 текста, группы объявлений и названия кампании. Мы берем его, используя регулярное выражение из журнала доступа, и ищем его в базе данных SQL.

4
14.02.2012 17:44:59
@Jeff Wu Я прочитал твой ответ и, в частности, твою правку. Интересно, как вы добавили свои собственные параметры запроса к целевым URL-адресам - у нас уже запущено много кампаний, так что это было бы очень кропотливо. Для тех, кому это интересно, сценарии Google AdWords являются одним из способов сделать это. Вот несколько полезных ссылок: документация Google и пример сценария добавления параметров в URL
mozz100 18.09.2013 11:19:20
Это довольно круто, я не знал об этой библиотеке Javascript, когда мы это реализовали. Я написал скрипт на Python, чтобы взять CSV рекламы и добавить тег к каждой из ссылок. Затем наш менеджер кампании возьмет CSV и загрузит его в AdWords с помощью утилиты для ПК.
Jeff Wu 18.09.2013 17:10:53

Вот мысль: есть ли вероятность, что gclid - это просто криптографический хеш, а именно bit.ly или какой-либо другой сокращатель URL?

В этом случае содержимое хешированного текста будет записано в базу данных и заменено уникальным идентификатором.

В конце концов, gclid сокращает кучу длинных текстов.

Принимает этот пример: www.example.com?utm_source=google&utm_medium=cpc

Преобразуется в это: www.example.com?gclid=XDF

так же, как сокращение URL.

Чтобы восстановить криптографический хеш, понадобился бы заменительный шифр ... не такая простая задача: https://crypto.stackexchange.com/questions/300/reverse-engineering-a-hash

Может быть, кто-то глубоко копается в журналах, ищет шаблоны и т.д ...

0
13.04.2017 12:48:18
Нет, gclid определенно не является криптографическим хешем, так как он обладает ужасной энтропией (gclids из той же учетной записи будет очень похожим). , Что-то закодировано в этих gclids, но выяснение, что или как вообще другое дело.
Draemon 18.01.2013 14:48:33

Похоже, мой представитель слабый, поэтому я просто опубликую другой ответ, а не комментарий.

Это не ответ, ясно. Просто высказываю некоторые мысли.

Когда вы включаете автоматическую пометку в Adwords, параметры gclid не добавляются к целевым URL. Скорее они добавляются к целевым URL во время выполнения серверами отслеживания кликов Google. Итак, происходит одно из двух:

  1. Серверы кликов хранят gclid вместе с идентификаторами сущности Adwords, чтобы в дальнейшем Google Analytics могла их найти.

  2. У gclid есть идентификаторы сущностей, которые каким-то образом закодированы, чтобы Analytics могла их декодировать.

С точки зрения производительности кажется маловероятным, что Google реализовал бы что-то подобное варианту 1. Принудительное использование Google Analytics «присоединения» gclid к идентификаторам Adwords кажется исключительно неэффективным в масштабе.

0
14.02.2013 22:47:46

gclidПараметр кодируются в протоколе буферах , а затем в варианте Base64.

См. Это руководство по декодированию и интерпретации gclid , включая функцию PHP (лицензированную Apache), которую вы можете использовать.

Внутри него есть три закодированных параметра, один из которых является меткой времени. Другие 2 пока не известны.

Что касается понимания того, что означают эти другие параметры, может быть полезно сравнить его с eiпараметром, который закодирован чрезвычайно похожим образом (в основном, буфер протокола с удаленными ключами). eiПараметр также имеет метку времени, с тем, что , кажется, быть микросекунд, а 2 другие целые числа.

17
24.12.2013 00:42:26
+1. 5 лет спустя и кто-то думает попробовать протобуф. Надеюсь, кто-нибудь когда-нибудь поймет, как связать это с adwords!
Draemon 17.12.2013 00:54:26

Я думаю, что вы можете получить все вкусности, связанные с gclid через Google Adword API. В частности, вы можете запросить отчет об эффективности кликов.

https://developers.google.com/adwords/api/docs/appendix/reports#click

4
11.03.2014 21:06:01
Да, это новая опция, которую предоставляет Google. Вы не можете получить очень старые исторические данные из этой конечной точки API, так что это просто хорошо для новых данных.
Bani 5.11.2014 16:04:37

Это не программный способ декодирования параметра GCLID. Скорее всего, вы просто пытаетесь определить кампанию, группу объявлений, ключевое слово, место размещения, рекламу, которая привела к клику и конверсии. Для этого вы можете загрузить GCLID в AdWords в виде отдельного типа конверсии, а затем сегментировать по типу конверсии, чтобы перейти к критериям, которые инициировали конверсию. Эти шаги:

  1. В пользовательском интерфейсе AdWords выберите Сервис-> Конверсии-> Добавить конверсию с источником "Импорт из кликов".
  2. Посетите раздел справки AdWords об импорте конверсий https://support.google.com/adwords/answer/7014069 и создайте файл массовой загрузки со своими значениями GCLID, назначив для них новый тип конверсии "Импорт из кликов".
  3. Загрузите конверсии в AdWords в Инструменты-> Конверсии-> Действия с конверсиями (Загрузка) в левой навигационной панели.
  4. Перейдите на вкладку кампании, Сегмент-> Конверсии-> Название конверсии.
  5. Найдите новое имя конверсии в списке сегментов, откуда и произошла конверсия. Продолжайте этот процесс на вкладке групп объявлений и ключевых слов, пока не узнаете критерии происхождения GCLID.
1
9.09.2016 14:00:35