КЛУБ СТОКОВЫХ ФОТОГРАФОВ, ИЛЛЮСТРАТОРОВ, ВИДЕОГРАФОВ и ИИ-ШНИКОВ

Текущее время: 04 06 2025, 08:22

Часовой пояс: UTC + 2 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 168 ]  На страницу Пред.  1, 2, 3, 4, 5, 6, 7, 8 ... 12  След.
Автор Сообщение
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 00:24 
Не в сети
Аватара пользователя

Зарегистрирован: 14 08 2007, 11:05
Сообщения: 1913
de-mi, cпасибо за предложение. Добровольцы для экспериметов, конечно, нужны, но их нужно много. И разных.

Эксперимент имеет смысл проводить по закрытым параметрам. Потому что по открытым его можно провести и без добровольцев.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 00:25 
Не в сети

Зарегистрирован: 05 10 2007, 23:03
Сообщения: 52
lvinst писал(а):
И что Вам тут не нравится? Если фотку посмотрели десять раз и купили дсять раз -- это очень хорошая фотка. Такая ситуация практически нереальна. А вы сравниваете эту ситуацию с более реальной -- когда посмотрели сто раз, а купили десять. И при этом делаете вывод,что функция очень резко падает, чуть ли "не по экспоненте".

ясно :)
Но все равно есть вероятность, что там используется просто d/v, а не d/(v-d+1), но чтобы узнать какой, нужно следить за появлением новых фотографий у какого-то автора, потом брать серию его новых фоток, появившихся в примерно одинаковое время, затем начинать следить за изменениями их рангов в портфолио и других показателей, которые могут повлиять на bm, затем сравнить динамику изменения рангов и изменения этих двух отношений (d/v, d/(v-d+1)). И только когда наберется приличная выборка, можно сказать, что с такой-то вероятностью играет значение такой-то показатель. Вообщем сложно все это :) Тем более нужно знать, с чем связаны те или иные изменения рангов, т.е. нужно хотя бы примерно знать, как часто происходит обновление bm. У вас есть наблюдения по этому поводу?


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 00:30 
Не в сети

Зарегистрирован: 05 10 2007, 23:03
Сообщения: 52
lvinst писал(а):
Юрий Христич писал(а):
lvinst писал(а):
продажи и просмотры равны нулю

Хм. Этот случай я не рассматривал. А ведь, он относительно легок для наблюдения. Фактически надо будет найти, две свежие и явно маловостребованные картинки с похожим набором слов, одна -- эксклюзивщика, другая -- обычного автора. И посмотреть, кто за кем идет, и с каким отрывом :) Потом наблюдение повторить над другой парой изображений. Чем больше наблюдений, тем надежнее вывод. Можно будет понаблюдать этот эффект и у "подопытных" авторов.


Я не это имела в виду. А практические выводы, которые можно сделать в такой ситуации. Другими словами, какие имеются способы, чтобы улучшить стартовые показатели ранжирования фотки.

Лично я знаю вот какие:
1) Использованием тематических лайтбоксов, которые будут перенаправлять траф на новые фотографии, потому как у новых фоток наибольшая вероятность получить высокий bm.
2) Раскрученное портфолио :)
Что еще добавите?


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 00:58 
Не в сети
Аватара пользователя

Зарегистрирован: 14 08 2007, 11:05
Сообщения: 1913
neo писал(а):
Но все равно есть вероятность, что там используется просто d/v, а не d/(v-d+1),


Исключать ничего нельзя. Но d/v, не описывает драматическое падение фотки в ситуации превышения продаж над просмотрами. А мой вид зависимости описывает. Причем падение будет столь же стремительным, сколь был и стремителен взлет при приближении числа просмотров к числу продаж.

Наблюдать за ранжированием, чтбы определить вид этой функции -- практически бесполезно. Потому что мы не видим значения самой функции f. Мы можем наблюдать лишь за значением ранга, соответсвующему значению функции f. А этого недостаточно. Ибо большие изменения значений функции f могут соответсвовать маленькому изменению ранга.


Тут полезными могу быть ситуации со всякими глюками, типа отключения счетчика загрузок. Нужно ждать очередного глюка.
neo писал(а):
нужно хотя бы примерно знать, как часто происходит обновление bm. У вас есть наблюдения по этому поводу?


В нормальной ситуации -- раз в сутки. Чаще -- накладно.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 01:26 
Не в сети

Зарегистрирован: 05 10 2007, 23:03
Сообщения: 52
lvinst писал(а):
Наблюдать за ранжированием, чтбы определить вид этой функции -- практически бесполезно. Потому что мы не видим значения самой функции f. Мы можем наблюдать лишь за значением ранга, соответсвующему значению функции f. А этого недостаточно. Ибо большие изменения значений функции f могут соответсвовать маленькому изменению ранга.
Ага, но думаю вид не так уж и важен, потому как при среднем d/v 0.1-0.2 он не слишком сильно отличается от вашего. Но наблюдение за рангами все же имеет практический смысл - можно легко определять, какие параметры влияют и насколько сильно (конечно мерить придется в разнице рангов). При этом не нужно искать "одинаковых" авторов и фотки - все параметры зафиксированы, а вероятность одновременного изменения двух и более (напр., кол-во оценок и продаж) параметров достаточно мала. Оценить последствия изменения той или иной хар-ки, как я уже и говорил, можно через разницу начального и конечного рангов по какому-нибудь поисковому запросу. Вообще можно было бы сформировать запрос, который бы включал все фотки (что-то типа people or women or blue и т.д.), тогда бы ранг было взять как значение f, но айс показывает только первую штуку. Можно, конечно, поизвращаться и составить такой же рейтинг самому на основе нескольких ключевиков, но это очень муторно и не для всех фоток можно будет найти их точное расположение (только интервал).


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 09:47 
Не в сети
Аватара пользователя

Зарегистрирован: 06 02 2006, 12:02
Сообщения: 2550
Откуда: Волгодонск
Мне кажется, что мысль исследователей Великого и Ужасного БМ потекла по второстепенному руслу. D&V, конечно, играют какую-то роль, но основной коэффициент должен выводиться из смысла самого названия ВМ: Best Match - лучшее совпадение критериям поиска. Т.е. поисковые слова и ключевые и их соотношение определяют основной коэфф. с максимальным весом. Исследование этого соотношения более сложное, но имеет наксимальное практическое значение, поскольку, зная эту зависимость, можно подбирать оптимальный набор ключевых (по составу и кол-ву).

ZB: 2 картинки, одна имеет 50 кл.слов, другая - 10. Каждая дала совпадение по 2 словам из заданных 3-х. То есть коэфф1 = 2/50 = 0.04, коэфф2 = 2/10 = 0.20. Т.е. 2-я будет намного выше первой в ВМ. 3-я картинка: 10 слов и 3 совпадения, получаем 3/10 = 0.30 - выше второй. Если добавить коэффициенты "возраст картинки" и D/V, то порядок немного изменится.

Такое свойство БМ проясняет принцип подбора КС: лучше меньше, но лучше.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 10:33 
Не в сети

Зарегистрирован: 05 10 2007, 23:03
Сообщения: 52
iChip писал(а):
ZB: 2 картинки, одна имеет 50 кл.слов, другая - 10. Каждая дала совпадение по 2 словам из заданных 3-х. То есть коэфф1 = 2/50 = 0.04, коэфф2 = 2/10 = 0.20. Т.е. 2-я будет намного выше первой в ВМ. 3-я картинка: 10 слов и 3 совпадения, получаем 3/10 = 0.30 - выше второй. Если добавить коэффициенты "возраст картинки" и D/V, то порядок немного изменится.
Там все проще. Вы вводите 3 слова и вам уже не будут показываться фотки, не содержащие хотя бы одного слова из этих трех (если конечно не использовать оператор or). Т.е. изначально происходит фильтрация по словам, а затем полученный набор упорядочивается по bm.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 11:16 
Не в сети
Аватара пользователя

Зарегистрирован: 14 09 2006, 23:31
Сообщения: 2212
Откуда: Москва
iChip писал(а):
Мне кажется, что мысль исследователей Великого и Ужасного БМ потекла по второстепенному руслу. D&V, конечно, играют какую-то роль, но основной коэффициент должен выводиться из смысла самого названия ВМ: Best Match - лучшее совпадение критериям поиска. Т.е. поисковые слова и ключевые и их соотношение определяют основной коэфф. с максимальным весом. Исследование этого соотношения более сложное, но имеет наксимальное практическое значение, поскольку, зная эту зависимость, можно подбирать оптимальный набор ключевых (по составу и кол-ву).

ZB: 2 картинки, одна имеет 50 кл.слов, другая - 10. Каждая дала совпадение по 2 словам из заданных 3-х. То есть коэфф1 = 2/50 = 0.04, коэфф2 = 2/10 = 0.20. Т.е. 2-я будет намного выше первой в ВМ. 3-я картинка: 10 слов и 3 совпадения, получаем 3/10 = 0.30 - выше второй. Если добавить коэффициенты "возраст картинки" и D/V, то порядок немного изменится.

Такое свойство БМ проясняет принцип подбора КС: лучше меньше, но лучше.

Какое глубокое замечание... Вы этот вывод только из названия сделали?


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 11:37 
Не в сети
Аватара пользователя

Зарегистрирован: 06 02 2006, 12:02
Сообщения: 2550
Откуда: Волгодонск
Макс Болотников писал(а):
Какое глубокое замечание... Вы этот вывод только из названия сделали?


В основном из названия и немного из здравого смысла и наблюдений.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 11:43 
Не в сети
Аватара пользователя

Зарегистрирован: 06 02 2006, 12:02
Сообщения: 2550
Откуда: Волгодонск
neo писал(а):
Там все проще. Вы вводите 3 слова и вам уже не будут показываться фотки, не содержащие хотя бы одного слова из этих трех (если конечно не использовать оператор or). Т.е. изначально происходит фильтрация по словам, а затем полученный набор упорядочивается по bm.


Условно, про OR думал, а для AND пример легко исправляется. Главное, смысл в том, что важнейшее для нас и для ВМ - ключевые, их количество и качество.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 15:08 
Не в сети
Модератор
Аватара пользователя

Зарегистрирован: 09 01 2007, 23:49
Сообщения: 4034
Откуда: Москва
iChip писал(а):
а для AND пример легко исправляется.

Исправьте...

После исправления получим простую формулу (это даже не формула а какой-то странный тавтологический лозунг): чем меньше слов, тем лучше, чем лучше слова, тем еще лучше.

Проверить, так ли это, очень легко. Откройте результаты поиска и посмотрите за "флуктуациями" (когда положение картинки в сортировке по БМ не совпадает с d/v). Если найдёте корреляцию с количеством слов, значит правда (при достаточно большом количестве наблюдений), не найдете, значит, скорее всего -- нет.

Я полагаю, что такой зависимости нет.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 20:03 
Не в сети
Аватара пользователя

Зарегистрирован: 14 08 2007, 11:05
Сообщения: 1913
iChip писал(а):
Мне кажется, что мысль исследователей Великого и Ужасного БМ потекла по второстепенному руслу. D&V, конечно, играют какую-то роль, но основной коэффициент должен выводиться из смысла самого названия ВМ: Best Match - лучшее совпадение критериям поиска. Т.е. поисковые слова и ключевые и их соотношение определяют основной коэфф. с максимальным весом. Исследование этого соотношения более сложное, но имеет наксимальное практическое значение, поскольку, зная эту зависимость, можно подбирать оптимальный набор ключевых (по составу и кол-ву).

ZB: 2 картинки, одна имеет 50 кл.слов, другая - 10. Каждая дала совпадение по 2 словам из заданных 3-х. То есть коэфф1 = 2/50 = 0.04, коэфф2 = 2/10 = 0.20. Т.е. 2-я будет намного выше первой в ВМ. 3-я картинка: 10 слов и 3 совпадения, получаем 3/10 = 0.30 - выше второй. Если добавить коэффициенты "возраст картинки" и D/V, то порядок немного изменится.

Такое свойство БМ проясняет принцип подбора КС: лучше меньше, но лучше.


Тут произошла терминологическая путанница. Дело в том, что функция, которая вычиляет соответствие запросу и функция, о которой я веду речь и котрую мы называем БМ -- это две разные функции.

Правильнее было бы функцию, о которой я веду речь назвать функцией ранжирования Fir. IstockRanking (TM) :smile:

А функцию, которая вычиляет релевантность запросу -- функцией релевантности Frel. Функция релевантности работает только с параметрами запроса и ключеыми словами (описанием) картинки. Она, естественно, не учитывает никаких свойств портфолио автора. Она просто вычисляет, насколько хорошо картика соответсвует запросу.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 21:41 
Не в сети
Аватара пользователя

Зарегистрирован: 14 08 2007, 11:05
Сообщения: 1913
Изображение

Вот доработанная схема с учетом замечания iChip.

Теперь практический аспект, сортировка по релевантности, как и сортировка по любому другому признаку, дает на выходе набор кластеров или групп картинок.


В каждый кластер входят картинки с одинаковым уровнем релевантности запросу (если сортировка по релевантности) или с одинаковой датой (если сотировка по дате). И уже в рамках такой группы применяется ранжирование (ранее я его называла БМ, но это не совсем верно). То есть картинки в каждой группе упорядочиваются по значению функции fir.

Если поисковый запрос популярный, то картинок в каждой из групп релевантности будет много. И картинка с плохим значением функции fir будет заброшена в конец "своей" группы.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 22:10 
Не в сети

Зарегистрирован: 05 04 2007, 12:06
Сообщения: 307
Откуда: Самара
Не думал, что этот топик перерастет в обсуждение моего любимого БМ ) поэтому не читал его, а щас прочел.

Имеем две картинки, с одинаковым абсолютно всем, но - 1 картинка имеет 2 продажи, 2 картинка имеет 1 продажу, вторая выше по БМ, почему? а потому что первую купили на 10 и 20 недь, а вторую на 30 день :) (это абстрактный пример) ... еще неизвестно как на бм влияют продажи в хсмол, смол, медиум и т.д. ... т.е. возможно ли что продажа в лардже круче чем продажа в хсмоле? почему бы и нет? не так сложно расчитывать и вставлять в формулу, например коэффициент может быть просто колличеством денег приносимыми фоткой за единицу времени.
Теперь берем картинку которую сначала покупали раз в 5 дней, потом раз в 2 дня, потом 2 раза в день, потом 5 раз в день ... потом спустя определенное время 1 раз в день, и вот тут происходит резкое, необоснованное ничем падение бестматча, как это обьяснить?

Еще кстате меня прикалывает фотолия, там при приемке фотке тупо выставляется фиксированная релевантность, и больше она не меняется ... и пока не появится фотка с большей релевантностью (а чем больше фоток в базе, тем шанс этого меньше) то фотка так и будет висеть не двигаясь.

Есть главный секретный коэффициент - шедевральность картинки, и если вы будете его повышать то и прибудет с вами бестматч любого стока. А на остальные коэффициенты мы влиять неможем, только лишь наблюдать и радоваться/огорчаться.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: 28 10 2007, 22:28 
Не в сети
Аватара пользователя

Зарегистрирован: 14 08 2007, 11:05
Сообщения: 1913
Rellas писал(а):
Не думал, что этот топик перерастет в обсуждение моего любимого БМ ) поэтому не читал его, а щас прочел.


Не надо Айсовский алгоритм ранжирования называть БМ. Это вносит путаницу. БМ -- это сортировка с приоритетом релевантности поисковому запросу. А ранжирование работает всегда. Оно работает и при сортировке по дате, и при сортировке в портфолио.

Rellas писал(а):
Имеем две картинки, с одинаковым абсолютно всем, но - 1 картинка имеет 2 продажи, 2 картинка имеет 1 продажу, вторая выше по БМ, почему? а потому что первую купили на 10 и 20 недь, а вторую на 30 день :) (это абстрактный пример)


Если это абстрактный пример, то ценности он не имеет. А вот если Вы действительно наблюдали такое ранжирование, то это другое дело.

Rellas писал(а):
... еще неизвестно как на бм влияют продажи в хсмол, смол, медиум и т.д. ... т.е. возможно ли что продажа в лардже круче чем продажа в хсмоле? почему бы и нет? не так сложно расчитывать и вставлять в формулу, например коэффициент может быть просто колличеством денег приносимыми фоткой за единицу времени.


Думаю, достаточно просто суммы.

Rellas писал(а):

Еще кстате меня прикалывает фотолия, там при приемке фотке тупо выставляется фиксированная релевантность, и больше она не меняется ... и пока не появится фотка с большей релевантностью (а чем больше фоток в базе, тем шанс этого меньше) то фотка так и будет висеть не двигаясь.


Кем выставлятся, ревьювером?


Вернуться к началу
 Профиль  
Ответить с цитатой  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 168 ]  На страницу Пред.  1, 2, 3, 4, 5, 6, 7, 8 ... 12  След.

Часовой пояс: UTC + 2 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 7


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения

Найти:
Перейти:  
cron







???????@Mail.ru



Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB