В организации имеет смысл наладить фильтрацию контента интернет-трафика, например, запретив скачивание рекламы, порносайтов и т. п. Конечно, делать это нужно на основании распоряжения руководителя, но подготовить его системному администратору не составит труда.

Сегодня нет надежных алгоритмов определения типа содержимого. Например, сообщалось о разработке фильтров, анализирующих изображения на рисунках и позволяющих выявить порнографические фотографии, но о реальной эксплуатации таких технологий пока информации нет.

На практике применяется два подхода. Это блокировка сайта по ключевым словам (если на странице встретилось слово, занесенное в черный список, то загрузка такого содержимого будет блокирована) или по черным спискам (список сайтов, для которых известно, что они хранят определенное содержимое). Не стоит обольщаться, что такими списками будут "закрыты", например, все порносайты. Число порно сайтов превышает по разным оценкам несколько миллионов, и блокировать их тем или иным списком доступа просто нереально.

Увеличение числа правил обработки запросов снижает производительность прокси-сервера. Поэтому не стоит особенно увлекаться числом заблокированных доменов, следите за производительностью сервера и находите разумный баланс ограничений и скорости работы прокси. С точки зрения влияния на производительность прокси, лучше использовать ограничения по доменам назначения, чем применять сложные регулярные выражения. При этом обычно несколько тысяч строк с именами блокированных доменов не очень существенно сказываются на производительности сервера.

Основу таких списков блокировки лучше всего найти в Интернете по ключевому термину "blacklist". Так, можно использовать перечни с сайта http:// urlblacklist.com/ (сайт представляет коммерческую службу, поддерживающую актуальность таких списков, но условия его лицензии позволяют однократно загрузить эти списки; объем загрузки составляет около 18 Мбайт архивированных файлов), списки, используемые в дополнениях к Firefox, - см. http://adblockplus.org/ en/subscriptions или любые другие.

Загрузите их из Интернета, сохраните, например, в папке /etc/squid/blacklists по соответствующим разделам и создайте определения списков доступа. Если файл списка содержит имена доменов, то используйте строку (в примерах указаны названия файлов списка с сайта Urlblacklist.com):

acl porno dstdomain "/etc/squid/blacklists/porn/domains"

Если в файле списка даны регулярные выражения, то нужно определять правило следующим образом:

acl banners url_regex "/etc/squid/blacklists/porn/expressions"

Для списков по URL нужно использовать типы acl url regex, urlpath regex, dstdomregex - в зависимости от того, какой вариант вы имеете.

После чего включите в файл конфигурации правила, блокирующие запросы на сайты, включенные в такие списки:

http_access deny porno

После перезагрузки конфигурации прокси-сервера администратору нужно некоторое время анализировать результаты фильтрации. Как правило, в списках, полученных из Интернета, попадаются ресурсы, случайно попавшие в такой список и нужные для текущей работы. Кроме того, некоторая часть, например, рекламы не будет отфильтрована. Такие случаи надо отследить по файлам журнала работы Squid и добавить новые условия фильтрации.

Настройка использования полосы пропускания | Самоучитель системного администратора | Удаленная работа


Самоучитель системного администратора



Новости за месяц

  • Сентябрь
    2020
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс