К разработчикам этого сайта. - страница 2

 
Svinozavr >>:

1)2) Ты не понял: рассуждать о чьих-то критериях - странное занятие...

Люблю странные занятия.... :)

 
avatara >>:
Это знак не ботаника. ;)
Выдается за заслуги. И сотрудникам ДЦ. покупателям продукта...
Впору право на минимодерирование разрешать.


  У меня тож нет такой опции. Видно,  "рожей не сподобился..."(лицефейсом - мордой лица)
 
goldtrader >>:

Уже с полгода как не работает.
  

У меня поиск исправно работал с момента регистрации до апреля 10-го года.
И ещё, сколько крыжик не ставлю - "следить за темой" - не следит, проклятый.
Что касается техподдержки:

 
goldtrader >>:

Уже с полгода как не работает.
Сходите сюда - рецепт есть.

Поисковик иногда не работает, т.к. перестал справляться с текущими объемами данных. В данный момент мы разрабатываем совершенно новый поисковой механизм.
 
dimm писал(а) >>
Поисковик иногда не работает, т.к. перестал справляться с текущими объемами данных. В данный момент мы разрабатываем совершенно новый поисковой механизм.


А что за машину будуите использовать? Или совсем самопис? Ой, госопода - не советую это довольно трудная задача - Я как-то довольно долго обьщался с одним из создателей поисковика аск, "Железный Чевский" ( Игорь ) :) Ну он мне немного глаза открыл на тот уровень трудностей который стоит перед поисковиком - я бы скажу честно не взялся бы делать этот велосипед, или вы будите использовать гугловскию машину? У них же помоему есть и апи. Если мне память не изменяет. :)

 
SProgrammer писал(а) >>


А что за машину будуите использовать? Или совсем самопис? Ой, госопода - не советую это довольно трудная задача - Я как-то довольно долго обьщался с одним из создателей поисковика аск, "Железный Чевский" ( Игорь ) :) Ну он мне немного глаза открыл на тот уровень трудностей который стоит перед поисковиком - я бы скажу честно не взялся бы делать этот велосипед, или вы будите использовать гугловскию машину? У них же помоему есть и апи. Если мне память не изменяет. :)


Кто бы мог подумать раньше, что информатика и филология так близки.

 
Integer писал(а) >>


Кто бы мог подумать раньше, что информатика и филология так близки.


Это ты про что сейчас? :)
 
SProgrammer писал(а) >>


Это ты про что сейчас? :)


Про это:

Ну он мне немного глаза открыл на тот уровень трудностей который стоит перед поисковиком

 
Integer писал(а) >>


Про это:


Он вообще-то программист. :)) И поверь поиск - это очень и очень сложно. А иначе бы на каждом углу было бы по поисковику. Надо не искать - а находить. Понимаешь разницу. :) Но не суть... проехали.. :)

 
SProgrammer писал(а) >>


Он вообще-то программист. :)) И поверь поиск - это очень и очень сложно. А иначе бы на каждом углу было бы по поисковику. Надо не искать - а находить. Понимаешь разницу. :) Но не суть... проехали.. :)


Уууууу.... ээээ... ну тогда точно, лучше проехать....

Зачем нужны морфология и синтаксис или Как искать ветра в поле


Распространено мнение, что шаблон "*", означающий любой набор символов, достаточен для поиска в русских текстах. То есть все проблемы, связанные с особенностями морфологии (п. 5.3), решаются путем обеспечения развитого языка запросов (п. 2.2). Но представьте себе - Вы узнали, что искали ветер в поле и нашли. Чтобы найти эту информацию, Вы, вероятно, попросите компьютер поискать слова "ветер" и "поле". Но если в тексте были формы "ветра" или "полях"? Остается вариант шаблона - "вет*" и "пол*", что тут же выдаст Вам материалы о польской ветчине и политике вето! Отсутствие морфологии сильно, а иногда катастрофически влияет на чувствительность и избирательность поиска. Запрос "ветер И поле" уменьшает чувствительность, а "вет* И пол*" - избирательность.

Случаи, когда шаблон не спасает:

Слова, у которых в разных формах меняется основа (супплетивные формы): идти-шел, плохо хуже, я-меня, человек-люди, ребенок-дети

Слова с большим количеством словоформ. Привести список всех словоформ русского глагола (с причастными и деепричастными формами - до 250 различных форм) человеку, не имеющему лингвистического образования, очень трудно. Понять, все ли словоформы из этого списка "накрываются" шаблоном "*" - ещё труднее.

Слова с беглыми гласными и чередованиями. В словаре на 90000 слов, используемом в нашей системе, примерно четверть слов имеет чередования, которые не позволяют найти слово по шаблонам: (искать-ищу, окно-окон, расти-рос: запрос и* или ок* или р* даст много мусора)

Короткие (три-четыре буквы) слова: дом, хор, ... . Во всех языках, в том числе и в русском, имеется общая закономерность: чем чаще слова используются, тем они короче. Применение шаблона "*" в коротких словах приводит к большому количеству ненужных ссылок в списке найденных документов.

http://company.yandex.ru/technology/history/dict/

Причина обращения: