Обход ЯВМ реагирует 404-ссобщением в зависимости от регистра в URL
Разберитесь с регулированием ошибочных 404-сообщений в разделе "История обхода". Суть: если в названии папок и файлов структуры сайта присутствуют прописные (заглавные, в верхнем регистре) буквы, то в списках "Истории обхода" на главной странице ЯВМ они выглядят как строчные (маленькие, в нижнем регистре) и в результате выдают сообщение 404. Это давняя ошибка в самой CMS 1С-Битрикс. Тамошние горе-специалисты много лет не могут её осознать. Если в строке браузера совершать прямое обращение к некоему файлу сайта (например, PDF), то выявляется проблема при несоблюдении точного регистра всех символов УРЛа - сообщение 404. Если регистр символов правильный, как и в адресации/навигации на самом сайте, то файл открывается и загружается в браузер нормально. Но и на стороне ЯВМ также совершается ошибка - вторая ошибка: в базы ЯВМ почему-то УРЛ сайта поступает без сохранения регистра - все символы УРЛа в ЯВМ строчные. В результате и в диагностике ЯВМ тоже выдаётся сообщение 404. Хотя на самом деле файл (страница) присутствует. К слову, в данной CMS есть многолетняя проблема и с наличинем/отсутствием закрывающего слэша в навигации страниц.
Вопрос: почему в базы ЯВМ УРЛы сайта поступают с "обрезанными" регистрами без сохранения того, как это сделано в точной адресации/навигации на самом сайте? В результате данная ошибка множится уже в самой ЯВМ-диагностике и может влиять на ранжирование сайта.
Ведь использование регистра при именовании страниц/файлов - это удобно, эффективно и наглядно как для владельцев/редакторов сайта, так и для его пользователей. Вы же придумали когда-то ещё давно написание и сохранение в поисковой выдаче доменного имени сайта с использованием символов обоих регистров по заявке его собственников? Ну так почему здесь много лет этот момент у вас тут до сих пор недоработан?
Сравните (только не кликом, а копированием - первый загружается, второй 404):
https://www.senokosilka.ru/Law/GOST_12_2_111-2020.pdf
https://www.senokosilka.ru/law/gost_12_2_111-2020.pdf
это ошибки на стороне вашего сервера, яндекс правильно обрабатывает разные регистры
для примера, в индекс вполне возможно добавить url с разными регистрами
P.S. в своё время это позволяло накрутить PR в гугле