Как собрать досье на человека через интернет.

В комментариях к первой нашей статье, читатели просили побольше практических примеров и скриншотов, поэтому в этой статье практики и графики будем много. Для демонстрации возможностей «продвинутого» поиска Google в качестве целей были выбраны личные аккаунты автора. Сделано это, чтобы никого не обидеть излишним интересом к его частной жизни.

Image result for гуглохакинг

Хочу сразу предупредить, что никогда не задавался целью скрыть свое присутствие в интернете, поэтому описанные методы подойдут для сбора данных об обычных людях, и могут быть не очень эффективны для деанонимизации фэйковых аккаунтов, созданных для разовых акций. Интересующимся читателям предлагаю повторить приведенные примеры запросов в отношении своих аккаунтов и оценить насколько легко собрать досье на человека через интернет

Прежде чем заниматься сбором и анализом информации о конкретном человеке необходимо представить всю картину того, какие данные о человеке существуют.

Подобную карту нужно детализировать до уровня, необходимого для решения конкретной задачи. Любой поиск информации начинается с некоторого начального набора данных. В нашем случае это будет фамилия, имя и место работы. Остальные данные где-то есть, но связать их с имеющимися мы пока не можем. Поэтому мы формируем гипотезы и проверяем с помощью поисковых запросов.

Источниками информации о человеке могут быть:

  1. он сам: аккаунты в соцсетях, блог и т.п.;
  2. государство: базы данных налоговой, судебных приставов, судов и т.п. См. ссылки в статье
  3. кто-то еще (друзья, враги, СМИ, работодатель и т.п.)

В настоящей статье рассмотрим п.1. – будем вычислять аккаунты автора в социальных сетях.

[ad name=»Responbl»]

Цель номер один: ники пользователя

Что такое ник и как мы его выбираем?

Ник представляет собой наше имя в интернете: мы выбираем его, создавая свой личный почтовый ящик, а потом часто используем и в различных сервисах.

Мы ничем не ограничены при выборе ников, но есть любимые алгоритмы формирования наших интернет-имен:

  1. Игры со своим именем: фамилия, имя+фамилия, имя+год рождения, имя+дата, инициалы;
  2. Игры с именами любимых персонажей (tovbender, napoleon);
  3. Немного о себе: профессия, психология (coolhacker, murmur);
  4. Демонстрация увлечений: footballer, boxer;
  5. “Чтобы никто не догадался”: слово наоборот, русское слово в английской раскладке, слово на латыни и т.п.

Если мы не знаем ник, но знаем кое-что о человеке, мы уже можем строить предположения и проверять их.
Хорошим способом вычислить ник пользователя является поиск и анализ его страниц в соцсетях и поиск адреса личной электронной почты.

Начать поиск информации о конкретном пользователе можно с простого запроса, подобного следующему:

джон смит ромашка

где «ромашка» — название компании.

На текущий момент мы должны вспомнить, что некоторые особенности работы поисковика Google:

  • Google читает запрос слева направо.
  • Google не различает регистр: «Земля» и «земля» для него одно и то же;
  • длина запроса не должна превышать 32 слов;
  • * представляет одно слово в запросе;
  • можно искать точную фразу, взяв ее в кавычки;
  • между словами в запросе стоит невидимое логическое «И»;
  • Google сам умеет склонять слова;
  • Оператор «-» исключает из выдачи результаты, которые содержат выражение, помещенное сразу за данным оператором (обязательно без пробела).
  • в верху выдачи находятся страницы, которые, по мнению Google, являются самыми релевантными. Тем не менее это его догадка, так как наших мыслей он читать пока не умеет;
  • для уточнения параметров поиска необходимо владеть операторами продвинутого поиска (advanced search operators).

Теперь можно ввести аналогичный запрос по автору статьи и получить массу страниц, среди которых должна быть и искомые страницы в социальных сетях:

Информации в выдаче поисковика достаточно много, и чтобы найти страницы в социальных сетях нам придется пересмотреть большое количество страниц.

Примечание:

Кстати, а что делать, если мы хотим найти человека из определенной компании, но забыли его фамилию? Тут может помочь оператор звездочка:

джон * ромашка

А если мы ищем человека из ООО «Ромашка», а таких «Ромашек» — миллион: и АО «Ромашка», и АНО «Ромашка», и ФГУП «Ромашка» и т.д.

Вариант 1. Искать полную фразу «ООО Ромашка».

Вариант 2. «Минусовать» ненужные слова: -АНО – АО –ФГУП (но так можно «заминусовать» и нужные результаты, например если на странице говорится, что наша «Ромашка» подружилась с ФГУП «Апельсин».

Теперь нам необходимо сузить выдачу и найти страницу автора статьи в социальной сети «ВКонтакте». Это позволит нам определить один из ников пользователя, а затем и вычислить адрес электронной почты. Для этого будет полезно использовать такой оператор, как site. Он ограничивает поиск определенным доменом любого уровня.

Вторая ссылка уже ведет на страницу автора статьи в сети «ВКонтакте». Обратите внимание, что автор сознательно выбрал короткий ник: alexdorofeev. Не все интернет-ресурсы дают возможность самим задать ссылку на свою страницу, иногда она формируется автоматически, но может содержать в себе ник, взятый из адреса электронной почты.

Используя добытую информацию и знания, постараемся найти аналогичную страницу в сети Facebook.

Сначала на удачу в браузере введем следующий URL: https://www.facebook.com/alexdorofeev, но, к сожалению, увидим, что страница принадлежит кому-то другому. Тогда воспользуемся проверенным приемом и добавим в запрос site:facebook.com.

В результатах выдачи отсутствует прямая ссылка на профиль, который мы ищем, так как пользователь проявил в свое время бдительность и запретил «сдачу» его странички поисковикам

Здесь необходимо снова сделать небольшое отступление и вспомнить как работают поисковики и в том числе Google.

[ad name=»Responbl»]

Что поисковики сделать могут, а что не могут?

Поисковики в общих чертах работают по следующему алгоритму:

  1. боты поисковых машин обходят сайты;
  2. содержимое страниц индексируется;
  3. по запросу пользователей извлекаются ссылки на релевантные страницы.

Поисковики не могут:

  • проиндексировать информацию, доступ к которой возможен только авторизованным пользователям;
  • данные, которые доступны после заполнения форм, например, результаты выгрузки из различных баз данных;
  • качественно извлечь информацию из видео, фото, аудио-материалов.

Еще некоторые нюансы:

  • контекст: результат выдачи зависит от запроса пользователя, от истории его предыдущих запросов и от истории просмотров страницы другими пользователями;
  • поиск осуществляется только на том языке, на котором пользователь ввел свой запрос;
  • имеется некоторый конфликт интересов: поисковики зарабатывают на рекламе, на которую кликают пользователи, потому что нужные им страницы оказались не в самом верху выдачи;
  • действует цензура из-за нарушения чьих-либо прав (авторские, право на забвение и т.п.).

Facebook относится к той категории интернет-ресурсов, которые не очень жалуют индексацию своего сайта и о чем непосредственно сообщают в robots.txt:

Для обнаружения страницы скрытного пользователя на Facebook нам потребуется авторизоваться в данной сети и воспользоваться встроенным функционалом поиска. Ссылка на страницу пользователя может «утечь» и оказаться в выдаче поисковика, но только если пользователь сознательно опубликовал материал за своим авторством на всеобщее обозрение.

С помощью поиска страница автора легко обнаруживается:

Анализируя URL страницы, мы можем определить еще один ник пользователя: adorofeev.

Таким образом, мы уже раздобыли два ника: alexdorofeev и adorofeev. Так как пользователей на популярных ресурсах очень много, то ник может отличаться от того, что реально любит использовать человек, так его «родной» идентификатор уже кем-то занят. По этой причине у автора статьи ник на Хабре: alexdorofeeff, хотя больше нравится adorofeev.

[ad name=»Responbl»]

Зная ник, мы можем поискать еще страницы, потенциально связанные с нужным человеком.

Здесь мы снова отвлечемся на Google и вспомним следующие моменты:

  • По умолчанию Google ищет выражение (слово или фразу, взятую в кавычки) во всех частях страницы: в URL, в заголовке, в тексте, в тексте ссылок. В то же время специальные «продвинутые» операторы позволяют указать где именно нам нужно, что бы был искомый текст. Для этого нам необходимо использовать операторы: inurl:, intext:, intitle:, inanchor:, а также их собратьев с приставкой all.
  • Google понимает логические выражения и скобки. AND – логическое «И», по умолчанию именно оно стоит между словами разделенными пробелами в строке поиска. OR или I – логическое «ИЛИ».
  • Если мы применяем оператор, то после двоеточия должно быть искомое выражение без пробела.
  • Операторы с приставкой all позволяют их применить к ряду выражений после двоеточия, разделенных пробелами. Для этих же задач можно использовать операторы без all, но со скобками и логическими выражениями.

Поиграемся с оператором inurl, который ищет страницы, содержащие в URL страницы нужное слово. Так как мы уже знаем несколько ников автора, то можем сделать следующий запрос:

inurl:(adorofeev | alexdorofeeff | alexdorofeev)

В результатах выдачи мы тут же обнаружим страницы соответствующих аккаунтов и часть страниц будет принадлежать автору. Таким образом, если у нас есть предположения об используемых никах, мы можем в самом начале наших изысканий получить список потенциально интересных страниц.

Закрывая тему с никами, хочу обратить ваше внимание на сервисы, позволяющие быстро узнать используется ли данный ник в ряде популярных ресурсов. Так мы можем найти дополнительные страницы конкретного человека. Пример подобного сервиса: nameсhk.com

Поиск человека по фотографии.

Кроме того ещё можно искать по  фотографиям в сети. Тут в общем-то несколько возможных подходов — если где-то EXIF не потёрт и там оставлен, скажем серийник фотоаппарата, то можно «пробить» камеру по серийнику (есть сервисы для поиска украденных камер), и получить другие фотографии, сделанные этой камерой. Ну либо по содержанию, скажем через tineye.com, ну или через google images. Однако не факт, что фотки грузились самим пользователем, а не собраны роботом.

Ну вот, к примеру, выше мы нашли и показали ссылку на профиль в контакте. Там три фотки загружены. Скачиваем их, скармливаем TinEye и на второй фотке вот отсюда:

TinEye выдаёт нам:

Как узнать e-mail человека?

Теперь, заполучив набор любимых ников пользователя, мы можем попробовать узнать его личный e-mail. Зачем он нужен? Иногда нужно выяснить принадлежит ли конкретный e-mail данному человеку, чтобы определить авторство письма. Также е-mail будет полезен для поиска объявлений, оставленных пользователем на форумах и т.п.

[ad name=»Responbl»]

Мы знаем ники, но пока не знаем домены почтовых служб. Так давайте сделаем предположения и проверим. Раз пользователь из России, то вероятнее всего что он использует один или несколько следующих сервисов:

  • Mail.ru
  • Яндекс.Почта
  • Google Gmail
  • Рамблер Почта

Соответственно мы можем сгенерировать адреса (наши гипотезы на данный момент) с никами adorofeev, alexdorofeev и alexdorofeeff.

Как мы можем проверить, а существуют ли подобные адреса на самом деле? Один из вариантов: немного «пообщаться» с почтовыми серверами каждого сервиса по протоколу SMTP:

Шаг 1. Находим почтовый сервер для конкретного домена.

nslookup -type=mx "имя домена"

Шаг 2. Подключаемся к почтовому серверу и имитируем начало отправки сообщения. Если сервер на имя получателя ответит «ОК», значит есть такая учетная запись.

Вариант 1: e-mail существует.

telnet gmail-smtp-in.l.google.com 25

Вариант 2: e-mail не существует.

Верификация e-mail

Определив существуют ли почтовые адреса, мы можем попробовать определить связан ли конкретный адрес с нужным нам человеком.

На mail.ru некоторые пользователи создают свои страницы, к которым можно обратиться следующим образом my.mail.ru/mail/nick/

«Пробиваем» один из адресов:

Также можно посмотреть страницы пользователей на всех проектах Mail.ru, воспользовавшись комбинацией уже известных нам операторов inurl: и site:

inurl:ник site:mail.ru

Если мы знаем, как выглядит человек, знаем его имя или даже уже нашли его страницу в социальной сети ВКонтакте (наш случай), то задача проверки принадлежности определенного email-адреса значительно упрощается. Мы можем воспользоваться механизмом восстановления доступа к странице. Нам потребуется удача: пользователь с таким адресом должен существовать, ну и разместить свое фото.

Давайте проверим четыре варианта адресов для ника «adorofeev» и увидим, что для двух адресов страниц не существует вовсе, для одного – другое имя:

А вот для соответствующего адреса на Gmail.com мы находим страницу автора:

Итак, мы вычислили реальный личный адрес электронной почты.

Как вычислить корпоративный адрес электронной почты?

Здесь ситуация намного проще. Все дело в том, что многие организации имеют свои правила формирования имен учетных записей электронной почты, которые не отличаются особым разнообразием: инициалы + фамилия, первая буква имени + фамилия и т.п. Нам нужно лишь понять какое правило используется в конкретной компании, чтобы по нему сформировать адрес нужного нам человека.

[ad name=»Responbl»]

Отправляем в Google запрос следующего вида:

email @домен

Пролистывая результаты выдачи, находим индивидуальные адреса сотрудников и все становится очевидным.

Как вычислить пользователя instagram по гео-меткам?

Теперь попробуем вычислить аккаунт автора в Instagram. Сначала проверяем самые очевидные варианты: https://www.instagram.com/adorofeev/, https://www.instagram.com/alexdorofeeff и https://www.instagram.com/alexdorofeev/ Видим, что это не те аккаунты.

Определив, что человек работает в конкретной компании, мы можем искать фотографии с соответствующей гео-меткой. В нашем случае это будет «НПО Эшелон».

Мы видим, что публикации с данной гео-меткой в основной своей массе сделаны сотрудниками компании. Логично предположить, что среди подписчиков многих сотрудников компании «Эшелон» должен быть и аккаунт автора, который мы без труда и находим:

Как пользоваться машиной времени?

Проведя аналогичный анализ в отношении аккаунта в twitter, можно обнаружить, что автор вел сайт adorofeev.ru, который сейчас не доступен. Что делать в этой ситуации? Ведь материалы исчезнувшего сайта могут представлять реальный интерес. В практике автора была ситуация, когда подобный исчезнувший сайт содержал опубликованные материалы уголовного дела, с которым было интересно ознакомиться.

Если сайт выключили совсем недавно, то нам может помочь опять таки Google, предлагающий оператор cache: с помощью которого можно извлечь закэшированные страницы, добытые поисковиком.

cache:www.adorofeev.ru/

Мы видим, что сайт 5-го февраля еще был включен, но ничего интересного из себя не представлял.

Очень хочется заглянуть в более далекое прошлое – на несколько лет назад. Для этого подошла бы машина времени и, как ни странно, она есть и доступна любому любознательному пользователю по адресу: https://archive.org/web/

«Пробивая» сайт автора, можно увидеть, что в прошлом там были какие-то материалы:

Причем, выбрав определенные даты, можно увидеть контент сайта на конкретный момент:

Вместо заключения: несколько слов об автоматизации процесса и других операторах Google

Можно ли процесс поиска интересной информации с помощью Google автоматизировать? Можно, и неплохие попытки уже есть: скрипт theHarvester.

Надо отметить, что Google это не приветствует и борется, поэтому надежность результатов применения всевозможных скриптов придется дополнительно проверять. Даже просто играясь с вполне легальными операторами, которые мы рассмотрели выше, вы постоянно будете видеть капчу и будете доказывать, что вы не робот.

Статья получилась довольно объемной и мы не стали рассматривать многие другие операторы продвинутого поиска Google , которые могут быть также полезны в интернет-разведке. Если применение операторов в подобном ключе интересно, то мы обязательно продолжим эту тему в одной из следующих статей.

[ad name=»Responbl»]

Литература

  1. Как пробить человека через интернет.
  2. Интернет-разведка в действии: who is Mr./Ms. Habraman?
  3. Social Media in Identifying Threats to Ensure Safe Life in a Modern City Aleksandr Dorofeev, Alexey Markov, Valentin Tsirlov
  4. Google Hacking for Penetration Testers, Third Edition 3rd Edition by Johnny Long, Bill Gardner, Justin Brown.
Click to rate this post!
[Total: 17 Average: 4]

Специалист в области кибер-безопасности. Работал в ведущих компаниях занимающихся защитой и аналитикой компьютерных угроз. Цель данного блога - простым языком рассказать о сложных моментах защиты IT инфраструктур и сетей.

2 comments On Как собрать досье на человека через интернет.

Leave a reply:

Your email address will not be published.