Semalt: Google Analytics-те сілтемелер спамын бұғаттауға арналған керемет нұсқаулық

Nik Chaykovskiy, Semalt сарапшысы, сілтеме спам - веб-шеберлердің қазіргі кездегі проблемаларының бірі. Жағдай бірнеше жылдар бойы нашарлай түсті, яғни біреудің жолдама спам жасаудан көп ақша кететінін білдіреді.
Көңіл және анықтамалық спам
Енді спам Google Analytics есептеріне жол ашты. Спамерлер веб-сайттың деректерінде көрінуі үшін жүйенің осалдығын іздейді. Олар мұны олар веб-шебердің өздерінің веб-сайттарына кіріп, есепте не үшін тұрғандығын білуге деген қызығушылығын оятады деп үміттенеді. Мәселе мынада, олар трафикті арттырмайды. Олар бұны бот болғандықтан да жасамайды. Олар бару туралы хабарлама жасау үшін Google Analytics пайдаланған JavaScript бақылау кодын пайдаланады. Олар серпіліс жылдамдығы және келісімді талдау үшін пайдаланылатын басқа элементтер сияқты маңызды статистикалық мәліметтерді бұрмалайды. Анықтамалық мәлімет қажет болған жағдайда, әсіресе маркетингтік шешімдер қабылдауға сенетін болса, сілтемелік спамды бұғаттау өте маңызды.
Сілтемелік спамды бұғаттау қиынға соғады, өйткені спамерлер жылдам жұмыс істеп, спам мен дереккөздер санын көбейтуде. Бұл веб-шеберлердің осы дереккөздерді жою мен қара тізімге қосуға күш салуын жақсарту қажет дегенді білдіреді. Бұл әсіресе заңды трафикті қабылдамайтын жаңа сайттары бар адамдар үшін өте қиын. Мұндай сайттардағы спам мөлшерінің артуы күн сайынғы хиттерден асып түсетін көбірек жасырындықты тудырады.
Бұл қаншалықты оңай?
Бір парақ жазбаларды бір кіру ретінде жүктейді. Ghost спамерлері Google Analytics бақылау кодын қолданады және трафик туралы деректерді тікелей есептерге жібереді, осылайша келуді тоқтатады. Серверге бір бетті бір жерге жүктеу үшін 0,001 секунд кетуі мүмкін. Алайда, олар осы жалған кірулердің 100-ден астамын көптеген басқа сайттардың Google есептік жазбаларына мәжбүр еткен болуы мүмкін. Жеке хост сатып алу өте оңай. Спамерлер ROI-ге сенімді болған кезде, олармен бірге көптеген зиян бар.

Қысқа келетін шешімдер
Кейбір әдістер кейде соншалықты жетілдірілген, сондықтан сілтеме спамын бұғаттауға арналған шешімдер жұмыс істемейді. Солардың бірі - Darodar деп аталатын жұмбақ онлайн сервис. Келесі әдістер оны GA-дан тазарта алмады.
- .Htaccess файлы. Бұл елес спам сайтқа тигізбейтіндіктен жұмыс істемейді
- Рефераттан шығару тізімі. Жаңартулар жетіспейді.
- Шығару сүзгілері. Бұл ескірген әдіс, өйткені ол болашақ спамға ғана назар аударады және өткен спамның дерекқоры үшін кері емес.
Ерекшелік сүзгісі Darodar сілтеме спамын жоюға жақын қалды. Оның бірден-бір шектеуі - оның тұрақты және үнемі жаңартылып отыратын спам-спамерлер тізімінің болмауы.
Жіберілген жұмбақтар
Сілтемелер мен елестер туралы деректерді анықтау және бұғаттауға арналған шешім өте жаңарып, кеңірек мәліметтер базасынан алынады және өткен ақпаратқа кері әсер етеді. Оңтайлы шешім қабылдау үшін үш элементтің негізінде жұмыс істейді.
1-қадам: Спамды болдырмау үшін сегменттерді пайдалану
Сегменттерді қолданған дұрыс, өйткені олар деректерді үнемі өзгертпейді. Егер сүзгілерді пайдалану кезінде біреулер кездейсоқ сүзгіден өткізсе, оларды қайтарып алу мүмкін емес. Қанша уақыт болғанына қарамастан, сегменттерді қолдана отырып, ескі деректерге сүйене аласыз. Оларды ретроактивті түрде қолдануға болады.
2-қадам: Ерекшеліктер тізімін жүргізу
Slack - бұл веб-шеберлер сілтеме көздерін бақылау үшін қолдана алатын құрал. Бұл пайдаланушыны кез-келген жаңа сілтемелер туралы хабардар етеді және оларға жедел жол береді: күмәнді сілтеме көзін ақ тізімге қосу немесе қара тізімге енгізу.
1. Slack барлық сілтемелерді алады, және
2. Ол барлық нәтижелерді санау реті бойынша сұрыптау үшін PHP қолданады, содан кейін таныс тізбекті көру үшін веб-шеберге қорытынды тізімді береді. Егер болмаса,
3. Ол барлық күдікті спамды қолданушыға ақ тізім немесе қара тізім арасындағы таңдауды ұсынатын әлсіз арнаға жібереді. Олар қайсысын таңдайды, 4-қадамға апарады,

4. Ол үкімді таңдауды растау ретінде тексеретін параққа бағыттайды.
5. Баяу әрекет етіңіз, содан кейін барлық анықталған спамерлерді дерекқорда сақтайды және құлыптайды
6. Таза деректердің ақырғы дисплейі регекс форматында болады. Google Analytics-ке көшіріп қойыңыз.
Slack веб-шеберлерге шығарып тастау тізімін күніне кемінде бес рет жаңартуға мүмкіндік береді.
Шындығында бірнеше шешім жұмыс істей алады:
Бұл дәлелденген әдіс болғанына қарамастан, веб-шебер оны басқа әдістермен толықтырса, олардың барлық негіздерді жабатындығына көз жеткізу үшін одан да жақсы жұмыс істейді. Аталған шешімге қосымша:
- Google Analytics-тен белгілі боттар мен өрмекшілерді алып тастауға шақыратын құсбелгіні нұқыңыз,
- «Хост атауының сүзгісін қамтиды» қолданыңыз
- Печенье қолданыңыз
Жоғарыда аталған инклюзивті сүзгі кейде тиімді, бірақ ұзақ мерзімді перспективада ең жақсы шешім емес, себебі:
- Хост атын бұзу қиын емес, ал аналитик спамерлер оны осал ретінде жиі қолданады.
- Егер орнату дұрыс болмаса, нақты сілтеме жасаушыларды сүзіп тастауы мүмкін.