Место для ваших идей

Оставляйте пожелания по работе Вебмастера

Обход ЯВМ реагирует 404-ссобщением в зависимости от регистра в URL

Avatar
  • обновлен

Разберитесь с регулированием ошибочных 404-сообщений в разделе "История обхода". Суть: если в названии папок и файлов структуры сайта присутствуют прописные (заглавные, в верхнем регистре) буквы, то в списках "Истории обхода" на главной странице ЯВМ они выглядят как строчные (маленькие, в нижнем регистре) и в результате выдают сообщение 404. Это давняя ошибка в самой CMS 1С-Битрикс. Тамошние горе-специалисты много лет не могут её осознать. Если в строке браузера совершать прямое обращение к некоему  файлу сайта (например, PDF), то выявляется проблема при несоблюдении точного регистра всех символов УРЛа - сообщение 404. Если регистр символов правильный, как и в адресации/навигации на самом сайте, то файл открывается и загружается в браузер нормально. Но и на стороне ЯВМ также совершается ошибка - вторая ошибка: в базы ЯВМ почему-то УРЛ сайта поступает без сохранения регистра - все символы УРЛа в ЯВМ строчные. В результате и в диагностике ЯВМ тоже выдаётся сообщение 404. Хотя на самом деле файл (страница) присутствует. К слову, в данной CMS есть многолетняя проблема и с наличинем/отсутствием закрывающего слэша в навигации страниц.

Вопрос: почему в базы ЯВМ УРЛы сайта поступают с "обрезанными" регистрами без сохранения того, как это сделано в точной адресации/навигации на самом сайте? В результате данная ошибка множится уже в самой ЯВМ-диагностике и может влиять на ранжирование сайта.

Ведь использование регистра при именовании страниц/файлов - это удобно, эффективно и наглядно как для владельцев/редакторов сайта, так и для его пользователей. Вы же придумали когда-то ещё давно написание и сохранение в поисковой выдаче доменного имени сайта с использованием символов обоих регистров по заявке его собственников? Ну так почему здесь много лет этот момент у вас тут до сих пор недоработан?

Сравните (только не кликом, а копированием - первый загружается, второй 404):
https://www.senokosilka.ru/Law/GOST_12_2_111-2020.pdf
https://www.senokosilka.ru/law/gost_12_2_111-2020.pdf

Avatar
Алексей Жуков

это ошибки на стороне вашего сервера, яндекс правильно обрабатывает разные регистры

для примера, в индекс вполне возможно добавить url с разными регистрами 

P.S. в своё время это позволяло накрутить PR в гугле

Avatar
ООО Ульяновское
Цитата от Алексей Жуков

это ошибки на стороне вашего сервера, яндекс правильно обрабатывает разные регистры

для примера, в индекс вполне возможно добавить url с разными регистрами 

P.S. в своё время это позволяло накрутить PR в гугле

Вы сам вопрос прочитали? Почему в базе ЯВМ фигурируют УРЛы сайта со строчными буквами, в то время как те же самые УРЛы сайта имеют те же самые, но уже прописные соответствующие буквы? Вопрос понятен? Или в третий раз написать?

И ежели вы считаете себя квалифицированным специалистом, то потрудитесь, пожалуйста, по поводу Гугла не умничать, - а сообщить подробности. Первый раз раз слышу про какие-то накрутки в этой связи. На сайте мы всего лишь пытаемся для наглядности и соответствующего удобства использовать заглавные буквы при написании имён папок и имён файлов - только и всего. Например, для отличия созданных для специальных задач папок сайта от папок, создаваемых самой CMS в процессе её работы. Только и всего. Это понятно? Или тоже повторить?

Avatar
Алексей Жуков
Цитата от ООО Ульяновское

Вы сам вопрос прочитали? Почему в базе ЯВМ фигурируют УРЛы сайта со строчными буквами, в то время как те же самые УРЛы сайта имеют те же самые, но уже прописные соответствующие буквы? Вопрос понятен? Или в третий раз написать?

И ежели вы считаете себя квалифицированным специалистом, то потрудитесь, пожалуйста, по поводу Гугла не умничать, - а сообщить подробности. Первый раз раз слышу про какие-то накрутки в этой связи. На сайте мы всего лишь пытаемся для наглядности и соответствующего удобства использовать заглавные буквы при написании имён папок и имён файлов - только и всего. Например, для отличия созданных для специальных задач папок сайта от папок, создаваемых самой CMS в процессе её работы. Только и всего. Это понятно? Или тоже повторить?

чудес не бывает, если у вас возникают подобные проблемы, то напишите обработчик, который проверит наличие документа с правильным регистром и выдаст 301 редирект на правильную страницу

вот сайт на битриксе и подобных проблем нет https://www.ceramtrade.ru/upload/uf/98a/2020-CATALOGO_MAYOR.pdf 

P.S. накрутка PR использовалась исключительно для продажи ссылок, сейчас это не актуально в связи с отсутствием видимого значения PR

Avatar
Платон Щукин

Здравствуйте! Спасибо, что обратили внимание на ситуацию — передал информацию техническим специалистам. Будем разбираться.

Avatar
ООО Ульяновское
Цитата от Алексей Жуков

чудес не бывает, если у вас возникают подобные проблемы, то напишите обработчик, который проверит наличие документа с правильным регистром и выдаст 301 редирект на правильную страницу

вот сайт на битриксе и подобных проблем нет https://www.ceramtrade.ru/upload/uf/98a/2020-CATALOGO_MAYOR.pdf 

P.S. накрутка PR использовалась исключительно для продажи ссылок, сейчас это не актуально в связи с отсутствием видимого значения PR

Да, чудес не бывает. Бывает чья-то безалаберность или криворукость. Или то и другое вместе. Какой ещё обработчик? Вновь повторю - проблема в ЯВМ: УРЛы в индексе почему-то со строчными символами там, где должны быть прописные. В самом ЯВМ. Вследствие чего в ЯВМ эти УРЛы объявляются как 404. Но на самом деле страницы/файлы по этим УРЛам существуют. А их "отсутствие" может влиять на ранжирование. Проблемы самого Битрикса я знаю. В Битриксе так же десятилетиями не исправляются баги и ошибки. Но сейчас разговор исключительно о Яндекс.Вебмастере.

На сайте в ссылках все УРЛы такие, какие есть. И на самом сайте тоже всё открывается. Если кто-то извне ссылит на эти наши файлы некорректными УРЛами - их проблема. Пользователям на САМОМ нашем сайте пользователям предлагаются ДЕЙСТВУЮЩИЕ правильные ссылки со правильными УРЛами. И всё открывается. Это понятно? Или ещё раз специально для вас объяснить?

Чужие сайты мне совать не надо - мне до них никакого дела, их ЯВМ я НЕ ВИЖУ. И я сам знаю, что такое накрутка. И знаю про продажу ссылок. И про PR Гугла тоже. Знал ещё тогда, когда вы, молчелаэк, вероятно, ходили ещё в первый класс. Я не понимаю, какое отношение имеет регистр символа к такой накрутке. И в какой связи это. Я вообще спрашивал исключительно про ОТОБРАЖЕНИЕ УРЛов в Яндекс.Вебмастере. И про персонаж "Платон Щукин" знаю с года 2006-го. Впрочем, уже все привыкли, что в последние годы техподдержка служб Яндекса вменяемо отвечает только не менее чем с третьего раза. Сколько же времени приходится тратить на вас.

Вот вам скриншот https://disk.yandex.ru/i/qG-SQxnhIfd6jg. Отдельно отмечу феерический ужас того, что здесь нельзя даже иллюстрацию прикрепить. Для чего вообще данный технический форум? Феерический ужас. На скриншоте комментарии. И в третий раз вопрос: почему указанные символы в нижнем регистре строчными буквами и их 404?

Avatar
ООО Ульяновское
Цитата от Платон Щукин

Здравствуйте! Спасибо, что обратили внимание на ситуацию — передал информацию техническим специалистам. Будем разбираться.

Очень надеюсь, что это не автоботная отписка.

Avatar
Алексей Жуков
Цитата от ООО Ульяновское

Да, чудес не бывает. Бывает чья-то безалаберность или криворукость. Или то и другое вместе. Какой ещё обработчик? Вновь повторю - проблема в ЯВМ: УРЛы в индексе почему-то со строчными символами там, где должны быть прописные. В самом ЯВМ. Вследствие чего в ЯВМ эти УРЛы объявляются как 404. Но на самом деле страницы/файлы по этим УРЛам существуют. А их "отсутствие" может влиять на ранжирование. Проблемы самого Битрикса я знаю. В Битриксе так же десятилетиями не исправляются баги и ошибки. Но сейчас разговор исключительно о Яндекс.Вебмастере.

На сайте в ссылках все УРЛы такие, какие есть. И на самом сайте тоже всё открывается. Если кто-то извне ссылит на эти наши файлы некорректными УРЛами - их проблема. Пользователям на САМОМ нашем сайте пользователям предлагаются ДЕЙСТВУЮЩИЕ правильные ссылки со правильными УРЛами. И всё открывается. Это понятно? Или ещё раз специально для вас объяснить?

Чужие сайты мне совать не надо - мне до них никакого дела, их ЯВМ я НЕ ВИЖУ. И я сам знаю, что такое накрутка. И знаю про продажу ссылок. И про PR Гугла тоже. Знал ещё тогда, когда вы, молчелаэк, вероятно, ходили ещё в первый класс. Я не понимаю, какое отношение имеет регистр символа к такой накрутке. И в какой связи это. Я вообще спрашивал исключительно про ОТОБРАЖЕНИЕ УРЛов в Яндекс.Вебмастере. И про персонаж "Платон Щукин" знаю с года 2006-го. Впрочем, уже все привыкли, что в последние годы техподдержка служб Яндекса вменяемо отвечает только не менее чем с третьего раза. Сколько же времени приходится тратить на вас.

Вот вам скриншот https://disk.yandex.ru/i/qG-SQxnhIfd6jg. Отдельно отмечу феерический ужас того, что здесь нельзя даже иллюстрацию прикрепить. Для чего вообще данный технический форум? Феерический ужас. На скриншоте комментарии. И в третий раз вопрос: почему указанные символы в нижнем регистре строчными буквами и их 404?

ещё раз, страницы 

https://www.senokosilka.ru/Law/GOST_12_2_111-2020.pdf
https://www.senokosilka.ru/law/gost_12_2_111-2020.pdf

это абсолютно разные URL и то что одна из них отдаёт 404 это правильно - её нет

я вам предложил простой способ решить эту проблему самому и защитить себя от подобного в будущем, если вы не хотите это лично ваше дело


url могут в таком виде могут браться откуда угодно, но вы видимо не желаете разбираться, а желаете что бы за вас вашу работу выполнил яндекс - не выполнит

то что вы привели на скриншоте правильная работа, если указанный  url отдаёт 404, то именно это я.вебмастер вам и показывает


то что вы чего-то не понимаете это нормально, не стоит поэтому поводу злиться 

всё очень просто - внутренние системы гугла и яндекса регистронезависимые так исторически сложилось, дальше можете сами попробовать сделать выводы ;)


Avatar
ООО Ульяновское
Цитата от Алексей Жуков

ещё раз, страницы 

https://www.senokosilka.ru/Law/GOST_12_2_111-2020.pdf
https://www.senokosilka.ru/law/gost_12_2_111-2020.pdf

это абсолютно разные URL и то что одна из них отдаёт 404 это правильно - её нет

я вам предложил простой способ решить эту проблему самому и защитить себя от подобного в будущем, если вы не хотите это лично ваше дело


url могут в таком виде могут браться откуда угодно, но вы видимо не желаете разбираться, а желаете что бы за вас вашу работу выполнил яндекс - не выполнит

то что вы привели на скриншоте правильная работа, если указанный  url отдаёт 404, то именно это я.вебмастер вам и показывает


то что вы чего-то не понимаете это нормально, не стоит поэтому поводу злиться 

всё очень просто - внутренние системы гугла и яндекса регистронезависимые так исторически сложилось, дальше можете сами попробовать сделать выводы ;)


Я уже давненько понял, что искать точную правду в коллективе Яндекса бесполезно. Недочёт в самом Яндексе, но решать её как-то неким "обходом" должен я сам. Типичное поведение современных молоденьких разработчиков. Кто-то "наложил", а убирать другому. Ваша суть. Уровень вашей квалификации ограничивает вас в понимании того, что меня вторая ссылка никоим образом не интересует. Так как на сайте все ссылки определены как первая. Более того, в ЯВМ она (они все) передана сразу же после своего появления на сайте именно в своём истинном первом виде. Но, тем не менее, Яндекс зачем-то самовольно генерирует её в некорректном изменённом виде в своих функционалах, именно сбрасывая регистр. Моё мнение такое: либо вы попросту не разбираетесь в своей собственной системе, либо попросту морочите мне голову. Либо то и другое вместе. К слову, файлы мы так размещаем уже четвёртый год. И раньше такой ошибки в ЯВМ не было. Потому и обратил внимание только сейчас.

Всё это примерно как если бы в ГосУслугах система игнорировала в фамилии гражданина букву "ё", заменяя её на "е" в своих потрохах (но при этом а-ля всё нормуль, не беспокойтесь, а если беспокоитесь, то вы дурак), и потом объявляла бы незаконными все действия гражданина, так как его фамилия становится, по её мнению, неверной.

Так что ответа вменяемого я не получил. Неуд.

P.S. Я не злюсь. Мне феерически, просто феерически смешно. Уже ряд лет. Смешно по поводу квалификации сотрудников первой российской интернет-лаборатории. У вас даже КАПЧА здесь срабатывает только со второго раза. Видимо, в коде выставлен слишком короткий период автоперегенерации символов КАПЧИ, в результате чего нередко приходится делать это дважды. И никто понять не может, почему. Использовать КАПЧУ в коде типичного форума - это феерично.

Avatar
Алексей Жуков

вообще-то, я к яндексу не имею никакого отношения ;)

я вам предложил способ решения, но вы упёртый и видимо не очень умный, т.к. во-первых ни как не можете понять что разный регистр - это разные url и это правильно, поскольку коды символов разные, вы хотите изменить международный стандарт?

во-вторых, это немного не то место где стоит задавать подобные вопросы - это форум яндекс вебмастера, а не разработчиков яндекса, для этого используйте форму обратной связи https://yandex.ru/dev/feedback/?from=main

Avatar
ООО Ульяновское
Цитата от Алексей Жуков

вообще-то, я к яндексу не имею никакого отношения ;)

я вам предложил способ решения, но вы упёртый и видимо не очень умный, т.к. во-первых ни как не можете понять что разный регистр - это разные url и это правильно, поскольку коды символов разные, вы хотите изменить международный стандарт?

во-вторых, это немного не то место где стоит задавать подобные вопросы - это форум яндекс вебмастера, а не разработчиков яндекса, для этого используйте форму обратной связи https://yandex.ru/dev/feedback/?from=main

Ах, вот оно что. Значит, молодой человек, разговор с вами закончен. Самая большая неумность на форуме - это беспредметно влезать в чужое общение. Вы могли бы либо чисто поддержать претензию/предложение как представитель другого сайта и пользователь ЯВМ, либо чётко и аргументированно опровергнуть его. А не предлагать некие "способы". Техподдержка вроде как ответила в положительном ключе и надеюсь, меня не оставят без ответа. К тому же, данная проблема может, без сомнения, касаться и других сайтов.

Разработчики или не разработчики. Вы вообще понимаете, в каком контексте это слово? Я обратился к сотрудникам Яндекса как к разработчикам. Как к разработчикам ЯВМ. Это понятно? И вопрос конкретный к продукту этих самых разработчиков. Глаза разуйте и перечитайте ещё раз, пожалуйста. Или у вас проблемы с диалоговыми письменными когнитивами?

Разность по регистрам - она была, есть и будет. Так же как была, есть и будет таблица кодировки символов. Только какое это имеет отношение к тому, что УРЛ страницы/элемента сайта имеет конкретные изначальные символы (и в таком же неизменном виде они переданы в индекс ЯВМ), а Яндекс решил вольно дублировать/трактовать данную информацию и засовывать её в свои функционалы, вынося при этом диагностические вердикты?

Дескать, вот паспорт. А где водительские права? Нету? Значит, это плохой человек. Только на ум не приходит ситуация, что этого документа реально может и не быть. Потому что человеку, к примеру, ещё не исполнилось 18 лет. Этим и отличаются современные молоденькие ИТ-разрабы, что у них напрочь вытравлено человеческое понимание при конструировании сервисов. Любая обслуживающая информационная система должна лишь зеркально отображать данные пользователя, а не городить из них свой огород.

УРЛ с символами исходного регистра в ЯВМ есть, проиндексирован и присутствует в поиске. И вдруг откуда ни возьмись "параллельно" ему В ИНДЕКСЕ ЯВМ появляется другой "тот же" УРЛ, но с уже изменённым регистром. И участвует в диагностике сайта. Да, есть вот эти исходные анализы, но это не комильфо, - вот, больной, ещё анализы, которые "сделали" мы сами и теперь они будут присутствовать в анамнезе. Если и в этот раз не понимаете проблемы, то уж больше не позорьтесь тут.