Fork me on GitHub

Other articles


  1. Lucene - фасетный поиск

    После того, как пользователь получает первые результаты поиска он наверняка захочет ещё дополнительно отфильтровывать результаты выдачи. Фасетный поиск на этапе индексации сохраняет дополнительную информацию для вычисления всех возможный уточняющих вариантов последующей фильтрации поисковой выдачи, которые как бы подсказывают пользователю что можно ещё уточнить. Таким образом с помощью фасетной фильтрации каждый …

    read more

    There are comments.

  2. Как подружить Weka с Lucene (Tokenizer)

    В случае классификации текстовой информации качество может зависеть не только от выбора алгоритма но и от способа преобразования текстовых данных к математический виду - в случае Weka этим занимается StringToWordVector и одним из параметров у него задаётся тип токенайзера. Задача токенайзера вроде как несложная - преобразовать строку текста в массив слов, но …

    read more

    There are comments.

  3. Анализ тональности текста с помощью Weka

    Имеется заданный набор документов для которых уже заранее известна тональность: good, neutral, bad. Для нового документа необходимо определить какая у него тональность из трёх указанных. Идеального решения тут не существует ну хотябы потому, что понятие хороший/плохой/злой часто субъективно :) Но всё-же можно попробовать взять среднюю температуру по больнице задействовав …

    read more

    There are comments.

  4. Lucene - синтаксис запросов

    Как уже упоминалось ранее, между строкой запроса, которую вводит пользователь для осуществления поиска и методом, реализующим непосредственно сам поиск в Lucene, имеется промежуточный класс - Query. Этот класс можно создавать программно - причём можно создавать даже очень сложный Query, используя комбинацию из нескольких из них, тем самым достигая наилучших результатов поиска. Однако …

    read more

    There are comments.

Page 1 / 3 »

links

social