13 марта 2008 в 11:52

Как пользоваться picollator.ru.Чего от него стоит ждать, а чего – нет

Поиск нужной информации в Интернете не такое уж простое дело. Казалось бы, поисковые сервисы давно все проиндексировали и научились быстро обнаруживать вновь появляющиеся сайты. Искать можно не только страницы, но и видео, аудио, и т.д. (каким образом, это другой вопрос).
Для особо терпеливых людей с аналитическим складом ума придумали расширенные возможности построения запросов для поиска. (Я лично крайне редко ими пользуюсь, но, наверное, кто-то уже не представляет без них свою жизнь). Формулы расчета рейтингов релевантности результатов экономят нам кучу времени на просмотре найденной информации. Еще, например, есть сервисы, которым можно спеть в телефонную трубку песенку, – и они скажут, какая именно была песня и дадут послушать оригинал. Между прочим, сервис новаторский. Это один из немногих примеров, когда поиск осуществляется не по текстовой фразе, а непосредственно по цифровому «контенту». Очень забавно, попробуйте, если ваша компания оплатит вам счета за телефонные переговоры. Кстати, попробуем найти этот сервис, например в Yahoo с запросом «сервис спеть найти аудио сайт». И что мы видим? Бани и сауны в Москве, дневник Александра Жданова… А где же нужный сервис?

Поиск объектов при помощи ключевых слов и фраз – стандартный способ поиска в Интернете. Да, можно дополнительно задать фильтры по странам, языкам, типам файлов или доменов. Но правильно подобранный запрос поиска – ключ к успеху. Проблема в том, что не всегда в принципе можно сформулировать текстовый запрос. Единственный способ – использовать контент в качестве запроса.
При работе с сервисом поиска информации по изображениям picollator.ru это правило остается в силе. Вместо текстового запроса надо подобрать запрос-изображение. Иначе говоря, нужна достаточно хорошая фотография человека, информацию о котором мы хотим найти.
Какую фотографию нужно подать на поиск, чтобы получить оптимальные результаты? Для начала, заглянем в FAQ, опубликованный на сайте сервиса по ссылке www.picollator.ru/ru/faq и прокрутим страницу до вопроса «Существуют ли требования к загружаемым фотографиям?». Внимательно читаем ответ:
Тип изображения: TIFF, PNG, JPEG, BMP
Разрешение: не более 25 мегапиксел
Размер изображения: 128*128 пиксел и более.

Это очень важные параметры. Если загружаемое вами для поиска изображение не соответствует какому либо из заданных требований, вы ничего не найдете. А из требования к размеру изображения есть одно важное следствие – если линейные размеры лица на фотографии будут меньше 128*128 пикселей – вы его тоже не найдете. Даже если сама фотография имеет достаточно большие размеры, но лица на ней выглядят как горошины, то не ждите хороших результатов.

Идеальная фотография – это «фотография на паспорт»:
1.Однотонный фон;
2.Волосы зачесаны назад (лицо не перекрывается другими объектами);
3.Без очков;
4.Глаза смотрят вперед (нет поворотов и наклонов головы);
5.Мимика отсутствует;
6.Освещение равномерное;
7.Линия, соединяющая глаза горизонтальна;
8.Лицо полностью помещается на фотографии.
9.Размер: 1200х900 пикселя.
10.Размер лица: не менее 500х500 пикселей.
Из этих пунктов пользователю надо сделать один главный вывод. Область глаз на фотографии будет иметь решающее значение для результатов поиска.

Кстати, хочу сделать одну важную оговорку. Сервис picollator.ru не сохраняет фотографии, которые вы передаете в качестве запроса поиска, и соответственно никак их не использует. Когда вы видите у себя на экране результат поиска – вашей фотографии на сервере уже нет. И поэтому, если вы хотите использовать в качестве запроса одну и ту же фотографию еще раз, вам придется загрузить ее повторно. При этом результаты поиска могут измениться, только если в процессе поиска произошли изменения в индексе.

Очень важно расположение лица на фотографии. Поворот готовы, приподнятый или опущенный подбородок, волосы, зачесанные на лоб или назад. Нюансов предостаточно. А если искомая персона – это женщина, владеющая искусством макияжа, то можно ожидать очень разных результатов в зависимости от разных фотографий. Про влияние возраста на лицо человека и говорить не стоит. А как наше настроение способно изменить наше лицо! Посмотрим на следующий пример. У нас есть 3 фотографии одной девушки, попробуем что-нибудь найти в picollator.ru.

На первой фотографии девушка стоит ровно


Усложним задачу и попросим нашу модель наклонить голову

Результаты заметно поменялись. Основную роль тут сыграла прядь волос, упавшая на глаза.

А теперь возьмем более крупный план:


Результаты получились довольно разные, хотя и пересекающиеся. А ведь это все одна и та же девушка, снятая в приблизительно в одно и то же время на одну и ту же камеру с одним и тем же освещением! Делаем вывод – для получения более объективных результатов вам желательно подготовить несколько фотографий нужного лица.

Что же мы можем увидеть в результатах? Picollator.ru – довольно молодой сервис, и объем просканированных и проиндексированных данных пока еще невелик. Поэтому на данном этапе, скорее всего, будут найдены именно похожие лица, причем они будут похожи на вашу конкретную фотографию. Многозначность изображений намного выше многозначности слов. Это надо понимать и учитывать.

Следующее важное замечание касается правильного понимания результатов, которые вы перед собой видите. Когда вы запускаете поиск по ключевой фразе – поисковики возвращают вам результаты, отсортированные по релевантности с достаточно хорошей (но не всегда!) точностью. И вы к этому, скорее всего, давно привыкли. При поиске на picollator.ru гарантируется, что если в индексе уже есть фотография, точная копия той, которую вы отправляете на поиск, то вы получите ее первой в списке результатов. Но это должна быть точная копия по всем параметрам.

Каким образом формируется список результатов? Для этого почитаем в FAQ ответ на вопрос, который, на первый взгляд, имеет слабое отношение к нашей теме «Как работает функция «Найти похожие»?» Ответ: « При нажатии на ссылку «Найти похожие» под одной из фотографий, поисковая система покажет вам похожие изображения из индекса. При обработке фотографий создаются кластеры (группы) изображений, наиболее похожие друг на друга. Таким образом, когда вы нажимаете на кнопку «Найти похожие», вы видите изображения, которые система относит к одному кластеру. » Для нас особый интерес представляет фраза « При обработке фотографий создаются кластеры (группы) изображений, наиболее похожие друг на друга. » Это означает, что похожие изображения собираются в группы. Когда проводится поиск, для фотографии из условия находятся несколько наиболее похожих групп, которые отображаются в результатах. То что группа похожа на какую то фотографию, означает что вся совокупность фотографии данной группы «в среднем» похожа на заданную фотографию. Поэтому на экране можно видеть в результатах несколько похожих лиц, а также определенное количество других менее похожих результатов. Со временем эти группы могут быть перестроены и результаты могут улучшиться. 100% результат не гарантирует никакая поисковая машина в Интернете, по крайне мере, современная.

В заключение скажу, что сервис Picollator Online – это не уголовный розыск. Он не сравнивает левый глаз с левым глазом, нос с носом, ухо с ухом. Методы несколько иные. Он так же не гарантирует точного опознания личности по фотороботу, пусть даже очень искусно составленному. Но его результаты вполне могут оказаться вам полезны по мере развития системы, потому как с помощью picollator вы сможете найти страницы, на которых выложены подборки нужных вам фотографий.

Как же найти тот самый сервис, который «с голоса» по телефонному звонку определяет мелодию? Сервис британский и поэтому тут пригодится знание английского языка. Пусть будет фраза «search service audio by phone». Опять не получилось? Тогда другой запрос на Yahoo «discovery engine music». И пожалуйста www.shazam.com/music/portal. Вот что значит качественный поисковый запрос.
+6
2537
vzzvzz 14,7

Комментарии (28)

0
Aist, #
Рекомендую разбить пост habracut'ом, что бы не было такой простыни
0
great_boba, #
Что-то я не очень понимаю зачем мне (ну тут я подразумеваю и других) такой сервис?
как часто я на него буду ходить...ну загружу туда свою фотку, посмотрю кто на меня похож и уйду.
А сервису необходимо чтобы на него ходили часто, пользовались...
Не понятно!
Хотя, если это маленькой приложение к более мощному сервису по pattern recognition, которое делается для других проектов, а это так ... поразвлечься и получить бесплатный feedback, тогда понятно
0
vzzvzz, #
Сервис находится на этапе становления. Когда охват контента будет достаточный, можно будет например проверить - есть ли где то какая то ваша фотография или нет. Это так, в качестве примера. Применять такую систему можно довольно широко. Только не надо воспринимать Picollator Online как сервис "найди похожую знаменитость". Он пока таким кажется только потому что фотографий знаменитостей в интернете много и их проще заиндексировать. И вас сосчитаем, потерпите.
0
iamAnton, #
Вот здорово. Хороший сервис.
0
marysam, #
Товарищи, я отмечу, что называть Picollator сервисом в корне неверно. Picollator - это поисковая система и ни что другое, и ищет она не по текстовым запросам, а по загружаемому визуальному запросу.
Сервис же оперирует с ограниченной базой, подготовленной и фотографии там опредленного каечтва (очень высокого, крупное лицо, нет наклона головы, очков итд).
Сравниваете ваше фото с известными личностями на http://www.myheritage.com/ -он для этого и существует. А при помощи Picollator в будущем вы можете найти ресурсы. где размещены те или иные фотографии (конечно, еслим этот ресурс будет в базе).
Подробности о сервисах (если хочется поигриать со своими фотками) читайте тут..http://habrahabr.ru/blog/itwoman/36731.h…
0
great_boba, #
Зачем проверять есть ли где моя фотография?
Если это для соблюдения авторских прав, то любой фотобанк защищает фотографии изображением, что фотка принадлежит фотобанку
0
marysam, #
Всем известно, что даже зарубежные стоки Getty images и Corbis очень часто страдают от воровства фотографий и пиратства. Это не секрет. Защищают-то защищают, но не всегда эффективно
0
marysam, #
Водяные знаки легко убираются
0
piaff, #
А если ваши фотки кто-нибудь и как-нибудь использует? Хотели бы вы об этом знать?
0
great_boba, #
Если я фотограф, то перед выкладыванием засандалю какой-нибудь символ, как это делает любой фотобанк.
Если там фотография меня с подписью "это чмо" или "я этого люблю", то то что я ее найду мало что изменит
0
piaff, #
Ну. символ можно убрать.
А вашу фотографию кто-то может использовать для рекламы, например. И кстати, за несанкционированное использование фотографии можно получить приличную денежную компенсацию
0
fuck_u, #
Я такой сервис искал давно (года три назад). Но оказалось, что я его придумал и таких сервисов нет, спасибо, что притворили в жизнь "мою" задумку. Я пользуюсь вашим сервисом довольно давно (тут ваша сотрудница отписывалась), не сказать, что сервис работает идеально, но то что он работает практически на пределе возможностей современной (доступной) компьютерной техники это точно.
0
banzalik, #
А вот с очками подружитесь. Процент "очкариков" (не в обиду, я сам такой :)) велик, и все фотки у меня разумеется в очках и даже в паспорте, правах и пр.

Но в целом - молодцы!
0
marysam, #
Мы индексируем фотографии с людьми в очках, я имела в виду, что сервисы обработки фото, типа myheritage, обычно требуют не подгружать фото с очками.
0
Alexlexandr, #
потестировал, загружал в т.ч и групповое фото.
в этом случае сервис предлагал несколько типажей лиц в ответ.
обратил внимание, что в основном при поиске сравнивается пропорции овала лица, линия контура волос (челка, залысины и т.д.) , ориентации взгляда и вообще головы. Иногда общая колористика фотографии
Результаты кореллируют в этом свысле, играть интересно, но до практического применения наверное еще довольно много работы. Например сервис не различает пол фотографий :)
Хотя сравнивать результаты интересно
+1
marysam, #
Ни одна существующая система не способна различать пол, М или Ж, для этого нам пришлось бы просить вас на сайте (до поиска) сообщить нам кто вы, М или Ж, или просить прислать нагое фото для распознавания, значимых для определения пола мест.
0
Alexlexandr, #
Маша.
Пол человека определяет уровень гормонов, который в свою очередь определяет вторичные половые признаки отсюда...
Хочу поделиться с вами одной любопытной историей из своей жизни.
0
Alexlexandr, #
Как-то в центре Москвы в оффисе одной организации, бюджет которой превышает бюджет некоторых стран,я попал на небольшой, организованный на скорую руку банкетик.
Водка да яблоки на закуску. Может водка была паленая, может звезды так сложились, но... Иду я по весенней Москве. Солнечно ..Красиво, душа радуется. Но странное ощущение. Нет совсем красивых женщин вокруг. Вообще! Народу много. А красавиц.. Ни одной. Я удивился. Думаю, сейчас на эскалаторе тысячи человек на встречу. Уж точно кто то будет. Уже любопытство взяло.
И там таже картина. Я небыл пьян сколько то значим и был способен к анализу.
Догадался, что в голове просто выключился фильтр, который определяет отношение мужчины к женщине, делает ее в его глазах привлекательной и желанной. Да и вообще определяет по внешности пол человека. Женщины стали казаться какими то как бы "больными", бледными и слегка опушими и "помятыми" на лицо.
Безрадостная картинка вида женщин без обработки препроцессором привлекательности и сексуальности в моей голове, до сих пор легко вспоминается мною. Так она меня поразила тогда. Жаль, что я не попробовал в тот момент сравнить например женщин разных расс и т.п. Просто растерялся. Но все равно, кое что я тогда понял и кое в чем разобрался пожалуй. Для точности отмечу, что спустя примерно год похожий случай со мной повторился. И я мог проверить точность своего внутреннего анализа. К счастью это было в последний раз :)
Т.к. жить без такого "блока" в голове я не хотел бы , даже в научных целях :))
Но вспоминаю тот случай, попробую утверждать, что в задаче определение пола, просматриваются пути решения.
0
piaff, #
Вы привели пример из жизни. А как можно определить пол по статичной фотографии? По каким именно признакам машина сможет отличить мужчину от женщины? По одежде, прическе, макияжу? Я сама, когда смотрю на некоторые фотографии, не могу точно определить пол изображенного человека. Кстати, в рунете был такой случай, когда в полуфинал конкурса красоты попал... мужчина. Первые этапы конкурса проводились в режиме онлайн, и посетители голосовали за фотографии участниц. Фотографии данной "участницы" имели невероятную популярность среди мужской аудитории:)
0
piaff, #
И еще. Разве женщина не может быть похожа на мужчину, и наоборот? О некоторых дочерях говорят, что они точные копии их отцов, хотя между ними и разница в возрасте, и вторичные признаки.
0
Alexlexandr, #
Да может :)
Мой студенческий друг ,стройный болгарин , как то показывает мне фотку. На ней он, и какой то огромный, волосатый ,суровый человек. Я говорю:"Твой отец?"
Он насупился и отвечает:"Это моя мама :("!

Так вот. Никто не ждет 100% результата.
0
marysam, #
Выход есть! мы его найдем :) Раз уж народ так хочет искать по половому признаку
0
Alexlexandr, #
100% правильный результат не важен.
Вы можете спросить например пол человека или группы людей (например выделяя рамочками с номерами или разного цвета при предварительном анализе или руками пользователя)
А при отборе результатов поиска,( уже реализовав какой то механизм определения пола человека ), просто не показывать результаты с сомнительной вероятностью определения пола.
0
vzzvzz, #
Практика общения с пользователями показывает, что существенное большинство из них ждет именно 100% результат. В силу того, что человек хорошо владеет навыком распознавания лиц и довольно редко ошибается, он не склонен прощать ошибки машины.
В общем виде это будет слишком "сильный" фильтр - фильтр "результатов с сомнительной вероятностью определения пола". Конкретный мужчина может быть похож на конкретную женщину, это естественно. Я например, похож на свою мать. Такие результаты поиска надо показывать. Иное дело иметь опцию "показывать только похожих девочек/мальчиков". Но в любом случае эта опция вторичная по отношению к общему качеству поиска. Далее если мы на и без того не 100% результат наложим не 100% фильтр - итоговая выборка может являть собой печальное зрелище.
Задача решаемая, в том числе и с помощью разновидности экспертной система ( можно придумать какую нибудь непринужденную игру ). Но приоритет, невысокий. :-) По сравнению с теми же "лицами в очках".
0
Alexlexandr, #
А экспертную систему разве нельзя реализовать для такого определения?
Обучить её, руками тех же пользователей услуги?
Например показывать следующий результат, только после того, как проставлены галочки М и Ж на уже представленных фото.
Я не говорю что все это просто и делается одной левой.
Нужно конечно же выбрать правильные критерии анализа для такой системы.
Я просто думаю, что все это решаемо,раз уж вы сделали уже то что сейчас работает.
0
vzzvzz, #
Что касается групповых фото - мы добавим на сайт функциональность, которая поможет пользователям лучше ориентироваться в результатах поиска.
0
vivo, #
А почему не написано, что сервис понимает psd? ;)
0
vzzvzz, #
Psd понимаем, но в данном случае ничего не гарантируем.

Только зарегистрированные пользователи могут оставлять комментарии.
Войдите, пожалуйста.