Чистый интернет возможен?
Автор: Игорь Селиванов Дата: 24.02.2022 17:53
Что такое хороший интернет? Хороший интернет - это чистый интернет, а чистый интернет - это когда можно найти нужную информацию быстро и просто, и при этом по возможности без рекламы, мусора и спама в поисковой выдаче. Поисковый робот Нигмы по состоянию на 10.01.2022 скачал (и время от времени перекачивает) 120.800.300 страниц. Из 120.000.00 скачанных страниц доступны для поиска около 64.000.000, остальные - дубликаты, копии и прочий поисковый «мусор». Однако при этом общий размер очереди на скачивание примерно в 10 раз больше - 1.230.240.800 страниц. И данный список растёт быстрее первого: то есть каждый раз, когда скачивается новая страница, поисковый робот по ссылкам узнаёт о существовании ещё нескольких других страниц. Стоит отметить, что оба списка периодически проходят фильтрацию на поисковый спам, дубликаты и зеркала. Таким образом, в рунете уже давно перевалило несколько миллиардов страниц, среди которых, естественно, много дублей и страниц с несущественными различиями, немалую часть из которых поисковый робот Нигмы обошёл и добавил в базу поисковика. И это только малая часть, что есть, но про поисковый мусор, дубли и прочее я уже писал выше. Ведь известно, что заявления о том, что «рунет преодолел миллиард страниц» устарели, ведь он преодолел этот рубеж уже очень давно, просто далеко не все страницы включены в индекс Нигмы. На данный момент всё ещё около 20–30% (по сути - почти треть) документов рунета остаются непроиндексированными любой из существующих ныне поисковых машин (из оставшихся сейчас это Яндекс, Мэйл.ру и Нигма, которые обладают собственной базой, так как Рамблер, хоть ещё существует, видимо, уже лишён таковой, так как полностью перешёл на технологию Яндекс, а QIP и как портал, и как поисковая система полностью выбил из игры, белорусский TUT.by на территории всего Союзного государства заблокирован, а украинский META.ua так же вне игры, так использует лишь пользовательский поиск от Гугла без каких-либо собственных надстроек, наработок и поисковой базы в целом). Хотя некоторые даже считают, что их гораздо больше...
Автор: Игорь Селиванов
прочтений: 2683 оценки: 0 от 0
© Свидетельство о публикации № 40340
Цена: 1 noo
|
Ваши комментарии
|
Чат
Опросы
Музыка
Треки
НеForМат
Академия
Целит
Юрпомощь
О сервере
О проекте
Юмор
Работа
О нас
Earn&Play
Для контактов skype:noo.inc
|