>>218040
Понятно. Тобой какой-то другой перцептивный хэш используется - в вышеуказанной статье предлагается хэш, генерирующий 7 чисел на канал; в варианте ImageMagick, который я использовал при решении своей задачи, он считает их в двух цветовых моделях (по умолчанию, во всяком случае) и даёт 42 числа с плавающей запятой для трёхканального (RGB) изображения. Для сравнения в статье предлагается использовать Евклидово расстояние. Не могу сказать, насколько эти хэши сопоставимы в плане эффективности отсева, но чисто интуитивно (по аналогии с криптографическими хэшами или хэш-функциями, используемыми при реализации хэш-таблиц) вероятность нахождения ложного сходства у хэша с большей длиной должна быть ниже. Одновременно, конечно, важно ещё и как долго эти хэши считаются.
>На пикрил, скрин с экрана с UI пинтереста не мешает распознаванию.
Насколько я помню, реализация PHASH в ImageMagick в сочетании с Евклидовым расстоянием достаточно близко (но не слишком - дальше, чем, скажем, для изображений, отличающихся только количеством пикселей) оценивала разницу между похожими картинками вроде этой, то есть между теми, которые имеют существенные отличия только в отдельных частях изображения.