КЛУБ СТОКОВЫХ ФОТОГРАФОВ, ИЛЛЮСТРАТОРОВ, ВИДЕОГРАФОВ и ИИ-ШНИКОВ :: Просмотр темы

Какие-то стоки показывают статистику по поискоым фразам, а не по отдельным словам? Или просто перебирать возможные комбинации из популярных ключевых?

Так ведь спрос на текстовую информацию немножко отличается от спроса на коммерческое фото, да и статистики там конкретной нет (для этого кстати можно юзать овертюру или вордтрекер).

На стоках -- не знаю. Но я использую вот такой инструмент -- https://adwords.google.com/select/KeywordToolExternal. При определенных поправках (если пользоваться им осмысленно), может быть использован и для стоковых запросов. Важно, что он показывает устойчивые словосочетания и статистику поиска по ним.

А этой тулзой не пользуетесь?

Ну что, может быть уже начнем говорить про bm?:) ИМХО, во время недавних проблем у айса со счетчиком просмотров можно было легко выявить два главных фактора, влияющих на bm. В топ попадали, во-первых, фотки с отношением загрузок к просмотрам близим к единице, и, во-вторых, высоким кол-вом загрузок на ед. времени. У вас есть какие-нить наблюдения по этому поводу?

а как это БМ может зависеть от автора, только если посредством фоты

Часть 1. Общие соображения

f -- функция, вычисляющая БМ.
Значений БМ мы не знаем, а знаем только ранг, соответсвующий некоторому значению БМ.

Как сортируются знчения БМ -- тоже неизвестно. Можно предположить, что по убыванию. Тогда, чем "лучше" изображение, тем выше у нее значение БМ.

Исходя из этих соображений, я выбрала вид функции f как суммы двух функций, каждая из которых по отедльности характеризует изображение и автора. Или в следующих частях все уже есть?:)

Могут ли значения БМ быть отрицательными? По идее -- могут. Если применяется система штрафов за заспамливание ключевикв или за низкий процент приемки.

Таким образом, все, что характеризует автора или изображение в позитивном ключе идет в формулу бестматча со знаком плюс. Все остальное -- со знаком минус.

ok. Сегодня ждать?:)

Paha_L писал(а):

а как это БМ может зависеть от автора, только если посредством фоты

навскидку несколько гипотетических факторов: эксклюзивность, кол-во купленных работ, процент отказов. Все эти факторы говорят о качестве его фоток.

Поэтому айсу выгодно, чтобы новые работы первого увидело больше людей и им присваиваться коэффициент bm больше, чем для работ второго.

Часть 2. Возможный вид функции f1

ИМХО, рейтинг напрямую в БМ не учитывается. Его достаточно сложно учесть разумным образом. Скорее всего, рейтинг имеет значение только для сортировки результатов "по рейтингу".

Не могу поддержать людей ратующих за словесный минимализм (не знаю, но наверняка такие есть). Слов доложно быть много. Конечно, не должно быть дезинформации и полной отсебятины, но подробно описывать картинку надо.

Вот тут есть небольшой нюанс. Повышая кол-во ключевых слов, вы понижаете их суммарную релевантность карточке.

neo писал(а):

Вот тут есть небольшой нюанс. Повышая кол-во ключевых слов, вы понижаете их суммарную релевантность карточке.

Хе-хе. Люблю теоретиков. Сам имею слабость...

Но надо бы иногда соблюсти и экспериментальную "клиническу" строгость. Тем, кому не нужен страус -- эту картинку просто не откроют. Достаточно посмотреть на превьюшку. Соответственно, не изменится баланс d/v.

ok. 2 вопроса:

1) Чем вызваны вариации соотношения d/v?

2) Почему у айса этот фактор основной?

Я же не первого попавшегося страуса купил. Я их несколько нашел, посмотрел на них "подробнее". Купил самого подходящего. Остальные остались с "холостными" просмотрами. Логично предположить, что они "хуже".

У меня скорее другой вопрос: зачем они это скрывают? Зачем они устраивают из своего сайта некий клуб, с креативными сетями и т. д. Поощряют общение фотографов друг с другом. Загаживая попутно им бестматчевый рейтинг. Пока я это могу объяснить только, крайним лицемерием айстоковского руководства.

чем конкретнее ключевик, тем большее отношение d/v он даст.

Так ведь покупатели тоже ей пользуются:)

Invist, опять извиняюсь, но "отбор по поисковому запросу" -- это что? Предарительная фильтрация? Т. е. часть картинок с подходящими ключевыми, вообще не попадает в результаты поиска?

Да, конечно, по самым популярным запросам, типа: business, people, baсkground и т. д. количество результатов очень велико, и там флуктуации бестматчевой сортировки могут швырять картинки на несколько страниц вперед и назад. Но ведь и покупатели, формулируя такой "неумный" запрос, и увидя, что найдено несколько тысяч изображений -- наверняка, быстро учатся уточнять свои пожелания. Вообще, было бы полезно понаблюдать за реальными покупателями, как они ищут изображения.

lvinst писал(а):

Часть 2. Возможный вид функции f1

Что вы думаете по поводу характеристики кол-во продаж/время за какой-то период времени, например, за день или время между пересчетами bm? Насчет продаж и просмотров, т.е. вы считаете, что чем соотношение d/v ближе к единице, тем вес этого фактора больше, так?

Юрий Христич писал(а):

Я имела в виду, что по непопулярному запросу Вы, скорей всего, получите нерепрезентативную выборку. Например, маленькое число эксклюзивщиков в такой выборке будет присутсвовать.

Кроме того, чтобы убедится том, что эксклюзивность или какой-либо другой фактор оказывают влияние на БМ, нужно ставить более сложный случайный эксперимент.

В случае с эксклюзивностью, нужно свести на ноль влияние других факторов. Например, так:
1. Вводим популярный поисковый запрос, сортируем по дате.
2. Включаем в лайтбокс картинки с одинаковой датой загрузки, количествм продаж и просмотров, одним и тем же размером, рейтингом, количеством публичных лайтбоксов. То есть в идеале в нашем лайтбоксе должны оказаться полностью сравнимые по параметрам картинки эксклюзивщиков и неэксклюзивщиков (например, авторов без канистры). Вот тогда, для полученной выборки, можно вычислить коэффициент кореляции и получить ответ на вопрос:

neo писал(а):

lvinst писал(а):

Часть 2. Возможный вид функции f1

Что мы наблюдали в реале? Что при приближении просмотров к продажам ранг фотки резко увеличивался. То есть такие фотки оказывались отранжированными выше, чем фотки эксклюзивщиков. Эксклюзивщики взвыли, поскольку продажи у многих из них --- драматически упали.

Таким образом, когда первое слагаемоe фукции f1 оказывается близким по значению к a1, то его вклад в функцию f -- является решающим.

С другой стороны, когда продажи превышают просмотры, это слагаемое оказывается отрицательным по величине, то есть превращается в своеобразный "штраф" и фотка сваливается по БМ в полный даун.

ну штраф может начисляться по условию d/v>1.

А вот резкого увелечения я не видел. Когда у карточки отношение становилось максимальным среди остальных, она выходила в лидеры. Т.е. я не видел явных признаков экспоненциальной зависимости, только линейную.

Кроме того, чтобы убедится том, что эксклюзивность или какой-либо другой фактор оказывают влияние на БМ, нужно ставить более сложный случайный эксперимент.

neo писал(а):

чем конкретнее ключевик, тем большее отношение d/v он даст.

Ходим по кругу: http://www.zastavkin.com/forum/viewtopi ... start=3868

Вы правы, конечно, чем больше ключевых тем больше холостых просмотров. Это типичное теоретическое, логически безупречное предположение. Но мы не можем теоретически вычислить сколько в реальности изображение теряет из-за "лишних" ключевых, и сколько из-за них преобретает. Можно лишь высказывать личные предпочтения. Мне кажется, что от малого количества ключевых картинка больше теряет, чем приобретает (с учетом того, что тем кому она явно не нужна, откывать её не станут -- достаточно будет увидеть превьюху). С малым количеством слов картинка "всего-лишь" на сколько-то улучшает свой бестматч, но при этом сильно сужает область в которой может быть найдна.

А где Вы видите в моей форумуле экспоненциальную зависмость? Ее там нет.

lvinst писал(а):

И я про то же. Имеет ли смысл беспокоиться о параметрах, которые можно разглядеть только при таких невероятно стерильных условиях?
Или Вам с позиций чисто научного азарта интересно вычислить и спрогнозировать "флуктуации"?

Просто смотрим за поведением новых фотографий эксклюзивщиков и неэксклюзивщиков.

lvinst писал(а):

А где Вы видите в моей форумуле экспоненциальную зависмость? Ее там нет.

Я конечно не математик, но если зафиксировать кол-во продаж, т.е. x1=const, то вроде получается.

lvinst, уточните, пожайлуста, a1, a2, ... это веса для каждого фактора, так?

продажи и просмотры равны нулю

ну допустим будет положительныый результат, что из-за этого

Да уж. Вы сильно "не математик". Это даже не уровень средней школы. :smile:

Все равно, какие значения принимает x1, хоть фиксируйте ее, хоть не фиксируйте, а входит она в формулу сама по себе. Экспоненциальной зависимости там нет.

То что находится в знаменателе -- просмотры минус продажи плюс один -- имеет простой "физический" смыл: сколько раз фотку посмотрели, не купив. Единица добавляется, чтобы на ноль не делить в случае, когда продажи совпадают с просмотрами.

Ежу понятно, что в эксклюзиве БМ меняется в лучшую сторону. На сколько - это уже другой вопрос. И это зависит от конкретной работы. У одного и того же автора две похожие работы загруженные в один день с одинаковыми ключевыми продаются по разному.

И насчет количества ключевых. Тоже сильно зависит от типа изображения. Если это некий абстрактный бэкграунд, то зависимость почти прямая - чем больше ключевых, тем больше покупок. А если это что-то конкретное, ну например хирург со скальпелем, то все слова кроме прямо описывающих фотографию будут во вред.

Ну не все так очевидно. Для айса конечно в плюс иметь уникальный контент эксклюзивщиков, но с другой стороны и денег с него он получает меньше.

Да, но они все равно прибавят объема карточке (про хирурга идет речь). С другой стороны, если фотка дизайнеру вообще не подходит, он и не будет ее открывать.

lvinst писал(а):

Да уж. Вы сильно "не математик". Это даже не уровень средней школы. :smile:

Да это все понятно. Смотрите, допустим, x1=10; a1=1; Изменяем x2:
x2=10; f=10;
x2=11; f=5;
x2=12; f=3.3
...
x2=100; f=0.11

lvinst писал(а):

продажи и просмотры равны нулю

Хм. Этот случай я не рассматривал. А ведь, он относительно легок для наблюдения. Фактически надо будет найти, две свежие и явно маловостребованные картинки с похожим набором слов, одна -- эксклюзивщика, другая -- обычного автора. И посмотреть, кто за кем идет, и с каким отрывом

Потом наблюдение повторить над другой парой изображений. Чем больше наблюдений, тем надежнее вывод. Можно будет понаблюдать этот эффект и у "подопытных" авторов.

Например, можно предложить побыть в роли "подопытных": de-mi и Веронике.

Если, о великие, я вам нужна как подопытный кролик

И что Вам тут не нравится? Если фотку посмотрели десять раз и купили дсять раз -- это очень хорошая фотка. Такая ситуация практически нереальна. А вы сравниваете эту ситуацию с более реальной -- когда посмотрели сто раз, а купили десять. И при этом делаете вывод,что функция очень резко падает, чуть ли "не по экспоненте".

Юрий Христич писал(а):

lvinst писал(а):

продажи и просмотры равны нулю

Я не это имела в виду. А практические выводы, которые можно сделать в такой ситуации. Другими словами, какие имеются способы, чтобы улучшить стартовые показатели ранжирования фотки.

Но все равно есть вероятность, что там используется просто d/v, а не d/(v-d+1),

нужно хотя бы примерно знать, как часто происходит обновление bm. У вас есть наблюдения по этому поводу?

Наблюдать за ранжированием, чтбы определить вид этой функции -- практически бесполезно. Потому что мы не видим значения самой функции f. Мы можем наблюдать лишь за значением ранга, соответсвующему значению функции f. А этого недостаточно. Ибо большие изменения значений функции f могут соответсвовать маленькому изменению ранга.

ZB: 2 картинки, одна имеет 50 кл.слов, другая - 10. Каждая дала совпадение по 2 словам из заданных 3-х. То есть коэфф1 = 2/50 = 0.04, коэфф2 = 2/10 = 0.20. Т.е. 2-я будет намного выше первой в ВМ. 3-я картинка: 10 слов и 3 совпадения, получаем 3/10 = 0.30 - выше второй. Если добавить коэффициенты "возраст картинки" и D/V, то порядок немного изменится.

Мне кажется, что мысль исследователей Великого и Ужасного БМ потекла по второстепенному руслу. D&V, конечно, играют какую-то роль, но основной коэффициент должен выводиться из смысла самого названия ВМ: Best Match - лучшее совпадение критериям поиска. Т.е. поисковые слова и ключевые и их соотношение определяют основной коэфф. с максимальным весом. Исследование этого соотношения более сложное, но имеет наксимальное практическое значение, поскольку, зная эту зависимость, можно подбирать оптимальный набор ключевых (по составу и кол-ву).

ZB: 2 картинки, одна имеет 50 кл.слов, другая - 10. Каждая дала совпадение по 2 словам из заданных 3-х. То есть коэфф1 = 2/50 = 0.04, коэфф2 = 2/10 = 0.20. Т.е. 2-я будет намного выше первой в ВМ. 3-я картинка: 10 слов и 3 совпадения, получаем 3/10 = 0.30 - выше второй. Если добавить коэффициенты "возраст картинки" и D/V, то порядок немного изменится.

Такое свойство БМ проясняет принцип подбора КС: лучше меньше, но лучше.

Какое глубокое замечание... Вы этот вывод только из названия сделали?

Там все проще. Вы вводите 3 слова и вам уже не будут показываться фотки, не содержащие хотя бы одного слова из этих трех (если конечно не использовать оператор or). Т.е. изначально происходит фильтрация по словам, а затем полученный набор упорядочивается по bm.

а для AND пример легко исправляется.

Не думал, что этот топик перерастет в обсуждение моего любимого БМ ) поэтому не читал его, а щас прочел.

Имеем две картинки, с одинаковым абсолютно всем, но - 1 картинка имеет 2 продажи, 2 картинка имеет 1 продажу, вторая выше по БМ, почему? а потому что первую купили на 10 и 20 недь, а вторую на 30 день

(это абстрактный пример)

... еще неизвестно как на бм влияют продажи в хсмол, смол, медиум и т.д. ... т.е. возможно ли что продажа в лардже круче чем продажа в хсмоле? почему бы и нет? не так сложно расчитывать и вставлять в формулу, например коэффициент может быть просто колличеством денег приносимыми фоткой за единицу времени.

Еще кстате меня прикалывает фотолия, там при приемке фотке тупо выставляется фиксированная релевантность, и больше она не меняется ... и пока не появится фотка с большей релевантностью (а чем больше фоток в базе, тем шанс этого меньше) то фотка так и будет висеть не двигаясь.

Тут произошла терминологическая путанница. Дело в том, что функция, которая вычиляет соответствие запросу и функция, о которой я веду речь и котрую мы называем БМ -- это две разные функции.

Правильнее было бы функцию, о которой я веду речь назвать функцией ранжирования Fir. IstockRanking (TM) :smile:

А функцию, которая вычиляет релевантность запросу -- функцией релевантности Frel. Функция релевантности работает только с параметрами запроса и ключеыми словами (описанием) картинки. Она, естественно, не учитывает никаких свойств портфолио автора. Она просто вычисляет, насколько хорошо картика соответсвует запросу.

Не абстрактный пример:
Решил проверить правмльность выкладок (здешних).
1)Фото новое, продаж 0, просмотров 5. По поисковому слову нашлось на 17 стр. Один раз купили. На след. день по поиску нашлось на 3-й стр.
2) Фото старое, продаж 0, просмотров 25. Нашлось на 17 стр. Сегодня одна покупка. Завтра сообщу результат поиска.

РООН, скажите какой запрос (можно в личку)

lvinst писал(а):

И отчего зависит функция релевантности? Так, как описывает iChip?

neo писал(а):

lvinst писал(а):

И отчего зависит функция релевантности? Так, как описывает iChip?

А она не имеет большого практическго смысла.

Предположительно имеет такой вид:

frel= k1/x11

k1 -- количество слов из запроса, которые встречаются в ключевх картинки
х11 -- количество ключевых слов у картинки.

lvinst писал(а):

neo писал(а):

lvinst писал(а):

И отчего зависит функция релевантности? Так, как описывает iChip?

Ну как же, вы же говорите, что на ее основе формируются группы картинок. Т.е. как я понял группа с коэф-ом 0.2 будет стоять выше группы с 0.15, а порядок расположения картинок в группе определяется по fir. Правильно я понимаю?

Да, правильно. Но эта функция плохо рассеивает картинки. То есть по популярному запросу в каждой группе будет настолько много картинок, что никакого преимущества от попадания в эту группу Вы не извлечете. Айстоковское ранжирование при плохом значении функции fir закинет вашу картинку в конец группы. И будет она там стоять на 100 странице.

То есть, при плохом значении функции fir для картинки не имеет смыла уменьшать количество ключевых слов. Потому что такой картинке легче пробится по случайным малопопулярным запросам.