Независимое аналитическое интернет-издание "Искра" это право на информацию.

Бог коварен, но незлонамерен. © Альберт Эйнштейн

На главную страницу

Парольный вход для авторов.

автор: c до

Чистый интернет возможен?
Автор: Игорь Селиванов      Дата: 24.02.2022 17:53


     Что такое хороший интернет? Хороший интернет - это чистый интернет, а чистый интернет - это когда можно найти нужную информацию быстро и просто, и при этом по возможности без рекламы, мусора и спама в поисковой выдаче.
     
     Поисковый робот Нигмы по состоянию на 10.01.2022 скачал (и время от времени перекачивает) 120.800.300 страниц. Из 120.000.00 скачанных страниц доступны для поиска около 64.000.000, остальные - дубликаты, копии и прочий поисковый «мусор». Однако при этом общий размер очереди на скачивание примерно в 10 раз больше - 1.230.240.800 страниц. И данный список растёт быстрее первого: то есть каждый раз, когда скачивается новая страница, поисковый робот по ссылкам узнаёт о существовании ещё нескольких других страниц. Стоит отметить, что оба списка периодически проходят фильтрацию на поисковый спам, дубликаты и зеркала.
     
     Таким образом, в рунете уже давно перевалило несколько миллиардов страниц, среди которых, естественно, много дублей и страниц с несущественными различиями, немалую часть из которых поисковый робот Нигмы обошёл и добавил в базу поисковика. И это только малая часть, что есть, но про поисковый мусор, дубли и прочее я уже писал выше.
     
     Ведь известно, что заявления о том, что «рунет преодолел миллиард страниц» устарели, ведь он преодолел этот рубеж уже очень давно, просто далеко не все страницы включены в индекс Нигмы. На данный момент всё ещё около 20–30% (по сути - почти треть) документов рунета остаются непроиндексированными любой из существующих ныне поисковых машин (из оставшихся сейчас это Яндекс, Мэйл.ру и Нигма, которые обладают собственной базой, так как Рамблер, хоть ещё существует, видимо, уже лишён таковой, так как полностью перешёл на технологию Яндекс, а QIP и как портал, и как поисковая система полностью выбил из игры, белорусский TUT.by на территории всего Союзного государства заблокирован, а украинский META.ua так же вне игры, так использует лишь пользовательский поиск от Гугла без каких-либо собственных надстроек, наработок и поисковой базы в целом).
     
     Хотя некоторые даже считают, что их гораздо больше...


Автор: Игорь Селиванов прочтений: 1933 оценки: 0 от 0
© Свидетельство о публикации № 40340
  Цена: 1 noo



Ваши комментарии

Пароль :

Комментарий :

Осталось символов

Доступна с мобильного телефона
Чат
Опросы
Музыка
Треки
НеForМат
Академия
Целит
Юрпомощь


О сервере


О проекте
Юмор
Работа
О нас

Earn&Play
Для контактов
skype:noo.inc


Этот сайт посвящен Георгию Гонгадзе, символу борьбы за свободу, журналисту, патриоту, человеку... Ukraine NBU Hrivnya rate
Russian ruble rate
Noo Web System



Редакция за авторские материалы ответственности не несет
стать автором
Micronoo Links Neformat Links Noo Links Chess Links Forex Links Bloodway

Идея и разработка
компании NOO
На сайт разработчика