2
iNNOCENt
Цитата:
1) Некий робот раз в n (10?) минут считывает последние запросы с Dreamstime и сохраняет их в базу. Причём, сохраняется дата и время запроса + целиком запросы (словосочетания), без дробления на слова.
ладно еще дата, а вот что вам даст время запроса, помойму это будет бесполезный параметр. Кроме того, время и дата запроса могут очень сильно разростить базу до неимоверных размеров, что приведет сервис к очень медленной работе. Также время запроса скажет только о том, когда тот или иной дизайнер(и тд) искал карточку, на пример, утром, до обеда или после...
Мне кажется, и не тоьлко мне, что оптимально использовать статистику слова за неделю. сразу будут видны всплески и падения таких слов в запросах.
Словосочетания добавлю.
Цитата:
2) Далее, конечный пользователь где-то вводит 2-3 "основных" (т.е. общих слов, таких как beach, sea, summer и т.д.) ключевых слова и определяет период, за который он хотел бы учитывать статистику (вплоть до гибкого поиска с указанием конкретного периода дат).
С этим проблем не будет, надо только определится с точностью статистики (день или неделя)....
А зачем делить на общее количество запросов, ведь количество упоминаний данного запроса за период имеет тот же смысл, чем больше упоминаний, тем веше рейтинг. Ведь во всех случаях будет формироваться топ за промежуток времени, деление ничего не даст.
Какая разница, если вам выдаст что слово girl(например) упоминалось за неделю 235 раз, а запросов было 10 345? или вам выдаст рейтинг слова girl 0,0227???
Кроме этого, дримс выдает не все слова, а только либо первые либо последние за прошедшие 10 мин. Еще заметил, что ночью он пару раз обновлял статистику раз в 15 и раз в 20 минут... вроде...