Compartir a través de


IE8 и блокировка стороннего контента

В прошлых статьях мы уже говорили о принципах надежности в общем и о некоторых особенностях браузера. Защита конфиденциальных данных – важная часть безопасной работы. В данной статье мы поговорим об очень важной части конфиденциальных данных в сети: стороннем контенте.

Многие думают, что то, что они видят в адресной строке и сам сайт – это одно и то же. Однако сегодня многие сайты объединяют контент с разных сайтов. Переходя на язык терминов, сайт, к которому обращается пользователь (указанный в адресной строке) является первичным сайтом. Другие сайты, к которым обращается первичный сайт во время своей работы (пользователь не обращается к ним напрямую), являются сторонними сайтами.

Когда вы обращаетесь к первичному сайту, знайте, что он может собирать данные о том, как вы использовали сайт. Чего большинство пользователей не понимают, так это того, что технически сторонние сайты точно также могут собирать эти данные. Обычно пользователи не знают о том, какие именно сайты собирают данные, как они используют эту информацию сегодня и как смогут использовать ее в будущем.

Идентификация сторонних сайтов

Сегодня большинство интернет сайтов являют собой мозаику или mash-ups нескольких различных сайтов. Чтобы убедится в этом, можно запустить Privacy Report в Internet Explorer (IE8: меню Safety->Webpage privacy policy…; в IE7 выберите меню Page или View в IE6, и выберите Web Page Privacy Policy) находясь на любом сайте. Вот часть отчета с сайта новостей и второе изображение – часть отчета с сайта по кредитным карточкам.

clip_image002

clip_image004

В адресной строке указан первичный сайт, но диалоговое окно показывает все сайты, включая сторонние, с которых данный сайт использует данные. Первичный сайт посещает все указанные выше сайты, чтобы показать содержимое страницы.

Способ, с помощью которого сегодняшние сайты могут брать контент с других сайтов, прост и мощен и повсеместно используется. Это часть базового дизайна и структуры сети, позволяющая реализовать дополнительный функционал, например, интерактивная карта в середине сайта ресторана или ссылка «share this» в середине новостной статьи, которые так нравятся пользователям.

Сторонние сайты и конфиденциальные данные

В то же время совмещение информации из разных сайтов на одном вовлекает в себя вопросы конфиденциальности. Хорошим примером данной проблемы является опыт работы с электронной почтой. Многие системы для работы с электронной почтой особым способом помечают письма, которые пришли от неизвестного отправителя, блокируя находящиеся в них изображения и показывая предупреждения.

Тело сообщения тоже могут содержать изображения, которые помечены красным крестиком, а рядом написано что-то типа «Кликните здесь правой кнопкой мыши, чтобы загрузить изображения. Чтобы помочь сохранить ваши конфиденциальные данные, Outlook предотвратил автоматическую загрузку данных изображений из интернета».

clip_image006

Почему почтовые системы блокируют эти внешние изображения? Отправитель мог внести в отправленное изображение какую-либо информацию, которая уникальна для каждого получателя – например, имя файла или путь с электронным адресом получателя. Когда отправитель видит, что было загружено конкретное изображение, он узнает, что сообщение, отправленное на конкретную учетную запись, было открыто. Не загружая контент, получатель предотвращает раскрытие личной информации для неизвестных отправителей.

В общем любой элемент веб-контента, запрашиваемый компьютерами с веб-сайтов, раскрывает личную информацию тем сайтам. Это примитивная техника позволяет различным сторонним сайтам отслеживать посетителей на других сайтах, содержащих контент от этих сторонних сайтов. Когда несколько сайтов отображают контент (изображения или статьи) с одного и того же веб-сайта, этот вебсайт может с легкостью определить, на каком из сайтов находится конкретный посетитель.

Взять, к примеру, два совершенно несвязанных сайта – Site1.com и Site2.com, при этом и там и там используются изображения с сайта MySyndicatedPhotos.com. Пользователь просматривает Site1.com и Site2.com, а в этот момент браузер обращается к MySyndicatedPhotos.com с целью загрузить с него изображения, используемые на сайтах Site1.com и Site2.com. Сайт MySyndicatedPhotos.com может определить (различными путями), что конкретный пользователь одновременно просматривает оба сайта.

По мере посещения пользователем все большего количества сайтов, содержащих сторонний контент, авторы этого контента могут создавать некоторого рода анкеты с предпочтениями пользователя.

Несмотря на то, что cookie тоже вносят свой вклад в раскрытие персональной информации, то есть существует возможность «отслеживать cookie», по сути любой сторонний контент может функционировать в качестве cookie. Изначальное назначение контента (фотография, статья, логотип, текст или скрипт) не имеет значения, поскольку любой из этих объектов может быть использован для слежки за посетителями. Даже если пользователь заблокирует все cookie, любой иной контент может быть использован для сбора информации. Сторонний контент нельзя назвать ни плохим, ни хорошим, просто технически его можно использовать и таким путем.

Бывает ли такое на самом деле, возможно ли это чисто технически и другие вопросы

Еще раз уточню, что эта статья о том, что может делать сайт, когда несколько других сайтов используют с него контент, а не о том, что на самом деле делают сторонние вебсайты, когда на них ссылаются другие сайты. Что происходит с собранной информацией, находится на совести сторонних сайтов, но это очень сложно понять рядовым пользователям. Сторонние сайты могут иметь четкую и отлично прописанную политику, которой они отвечают. А могут и не иметь. Сотрудник компании-владельца сайта может ведь потерять ноутбук с собранной информацией или его компьютер будет подвержен атаке, за которой последует раскрытие персональной информации сотен тысяч пользователей. У владельца сайта могут иметься соглашения об обмене информацией с другими сайтами.

Не стоит рассматривать данную публикацию как описание техник, используемых для сбора информации, или контр-мер для борьбы с такими техниками. В статье обсуждаются способы (вышеупомянутый случай с электронной почтой и этот), которыми первичный сайт может передать информацию, помогающую идентифицировать посетителя, другим сайтам. К примеру, многие из веб-адресов диалога Web Page Privacy Policy достаточно длинные и содержат множество уникальных идентификаторов. Можно найти и другие обсуждения данной темы. Например, текущая дискуссия IRC посвященная разработке новых стандартов насыщенных веб-сайтов перекрывает нашу тему. Хотя она весьма обширна, некоторые ее части весьма существенны, например, как эта (можно ли выследить людей, когда они отсылают cookie-файлы) или эта («каждый, кто хочет выследить человека через Веб, может легко сделать это, даже без cookie … достаточно просто "снять отпечатки" человека с помощью строки агента пользователя, IP-адреса, размера экрана, других настроек доступных через js- и http- и т.п. и затем с помощью простого анализа сценариев разобраться кто есть кто, просто взглянув на "анонимные" данные строки поискового запроса, переданной AOL»)

Но веб-серфинг сам по себе не может быть анонимным или абсолютно безопасным с точки зрения персональной информации. Так, к примеру, провайдеры широкополосного доступа в Интернет могут легко определять, откуда подключился пользователь – из дома, с работы, из отеля или кафе. Обычно у провайдеров на сайте опубликована политика, с которой может ознакомиться любой пользователь. Любое программное обеспечение, запущенное на компьютере пользователя, может определить список посещаемых сайтов. На этом принципе основана работа таких функций, как History или панелей инструментов, которые копируют историю посещенных веб-страниц и публикуют ее в Интернете, чтобы пользователь мог в любой момент и из любого места получить к ней доступ. И тут снова важно знать условия использования таких инструментов и функций. Посещенные веб-сайты могут определять многие параметры посетителя, в частности его географическое местоположение). Кроме того, владельцы сайтов узнают информацию о том, какие ссылки нажимает пользователь и в какой последовательности.

Сторонние сайты и проблемы безопасности

Принимая во внимание тот факт, что веб-серфинг сам по себе не может быть анонимным ввиду специфики работы Интернета, какие проблемы это может принести обычным пользователям? Для многих надежность работы начинается с безопасности. Здесь риски безопасности очевидны: посещение одного веб-сайта несет потенциальную опасность загрузки вредоносного контента с другого. Пользователь посещает один сайт, который кажется ему надежным, но на нем присутствует контент с другого сайта. Найти примеры не так уж сложно: это происходит с сотнями и тысячами посетителей известнейших сайтов.

Понятие «надежность» подразумевает и безопасность личной информации, которая, в свою очередь, дает пользователям право выбора и контроль над информацией. Сегодняшние пользователи не могут проконтролировать, какие веб-сайты могут отслеживать их действия, а какие нет. В результате веб-сайты, которые по мнению пользователей надежны, могут безнаказанно собирать информацию об их действиях.

Основополагающим принципом Internet Explorer (и Microsoft в целом) является обеспечение контроля над ситуацией. Пользователи ждут от используемых браузеров защиты, в том числе, защиты личной информации. Под контролем мы понимаем, что пользователь проинформирован о том, что за ним следят, и имеет выбор, какой информацией делиться и на каких условиях. Предотвращение раскрытия информации означает блокировку контента. Блокировка контента влияет на внешний вид и функциональность страницы.

Еще одним вопросом является сбор информации: когда пользователь посещает один за другим веб-сайты, содержащие один и тот же сторонний контент, кто собирает и кто несет ответственность за собранную о посетителе информацию? В Интернете в том виде, в котором он существует сегодня, на эти вопросы очень сложно ответить.

Проблемы безопасности личной информации и надежность стороннего контента – тема достаточно сложная, но от того не менее важная. И как мы неоднократно упоминали, на пути к безопасному веб-серфингу есть много сложностей, требующих взаимодействия, сотрудничества с конкурентами и различных уступок. Безопасность персональной информации – это больше, чем простая блокировка cookie. Прежде, чем обеспечить пользователей контролем, необходимо их предупредить о существовании проблем. И режим InPrivate в IE8 – лишь первый шаг в верном направлении.

Дин Хачамович (Dean Hachamovitch)

старший менеджер Internet Explorer