Вопросы с тегом «full-text-search»

Поиск в тексте коллекции документов или полей свободного текста в базе данных, чтобы найти те, которые содержат слово или комбинацию слов.

2
Возможный INDEX для поля VARCHAR в MySql
Я работаю в базе данных MySql с такой таблицей: +--------------+ | table_name | +--------------+ | myField | +--------------+ ... и мне нужно сделать много запросов, как это (с 5-10 строк в списке) : SELECT myField FROM table_name WHERE myField IN ('something', 'other stuff', 'some other a bit longer'...) Там будет …

5
Какие технологии баз данных используют крупные поисковые системы? [закрыто]
Кто-нибудь знает, как Google или Yahoo выполняют поиск по ключевым словам по очень очень большим объемам данных? Какую базу данных или технологии они используют для этого? Это занимает несколько миллисекунд, но они проиндексированы более чем на миллиард страниц.

1
Руководство по ведению полнотекстового индекса
Какие рекомендации следует учитывать при ведении полнотекстовых индексов? Должен ли я перестроить или переорганизовать полнотекстовый каталог (см. BOL )? Что такое разумная частота обслуживания? Какие эвристики (аналогичные порогам фрагментации 10% и 30%) можно использовать для определения необходимости технического обслуживания? (Все, что ниже, - просто дополнительная информация, уточняющая вопрос и показывающая, …

3
Как реализуется LIKE?
Кто-нибудь может объяснить, как оператор LIKE реализован в современных системах баз данных (например, MySQL или Postgres)? или указать мне на некоторые ссылки, которые объясняют это? Наивным подходом было бы проверять каждую запись, выполняя регулярное выражение или частичное совпадение строк в интересующей области, но у меня есть чувство (надежда), что эти …

2
Поиск триграмм становится намного медленнее, так как строка поиска становится длиннее
В базе данных Postgres 9.1 у меня есть таблица table1с ~ 1,5M строк и столбцом label(упрощенные имена ради этого вопроса). Имеется функциональный индекс-триграмм lower(unaccent(label))( unaccent()сделан неизменным, чтобы его можно было использовать в индексе). Следующий запрос довольно быстрый: SELECT count(*) FROM table1 WHERE (lower(unaccent(label)) like lower(unaccent('%someword%'))); count ------- 1 (1 row) …

1
Недостаточно системной памяти в внутреннем пуле ресурсов для выполнения этого запроса
Один из наших производственных серверов сообщает об ошибке в журнале Ошибка: 701, уровень серьезности: 17, состояние: 123. Недостаточно системной памяти в внутреннем пуле ресурсов для выполнения этого запроса. Я искал эту ошибку и обнаружил, что это ошибка, и есть исправление с пакетом обновления 2. Вот подробности сервера: Microsoft SQL Server …

1
Получить частичное совпадение из индексированного в GIN столбца TSVECTOR
Я хотел бы получить результаты по запросу: SELECT * FROM ( SELECT id, subject FROM mailboxes WHERE tsv @@ plainto_tsquery('avail') ) AS t1 ORDER by id DESC; Это работает и возвращает строки с tsvсодержанием Available. Но если я использую avai(упал lable), он не может ничего найти. Все ли запросы должны …

5
Полный текстовый индекс SQL Server 2008 никогда не завершается
Наш веб-сайт имеет базу данных SQL Server 2008 R2 Express Edition с полнотекстовой индексацией для поиска по нашему веб-сайту. Каждый раз, когда новая запись добавляется или обновляется в одной из проиндексированных таблиц, процесс индексации никогда не завершается. В течение последних нескольких недель я отслеживал состояние, используя в основном тот же …


4
Полнотекстовый поиск приводит к большому количеству времени, потраченному на 'инициализацию FULLTEXT'
В настоящее время я пытаюсь выполнить несколько запросов к дампу данных комментариев переполнения стека. Вот как выглядит схема: CREATE TABLE `socomments` ( `Id` int(11) NOT NULL, `PostId` int(11) NOT NULL, `Score` int(11) DEFAULT NULL, `Text` varchar(600) NOT NULL, `CreationDate` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, `UserId` int(11) NOT …

2
Будет ли полнотекстовый каталог с изменениями отслеживания: автоматически обновляться, если отслеживание изменений для этой таблицы не включено?
У меня есть эта таблица базы данных, которая должна поддерживать полнотекстовый индекс в актуальном состоянии. Однако я не вижу, чтобы это происходило вообще (нет ошибки в журнале, потому что последний журнал, который я вижу, был, когда я запустил его вручную). Вот что я вижу ... но на самом столе ... …

1
Почему LIKE более чем в 4 раза быстрее, чем MATCH… ПРОТИВ индекса FULLTEXT в MySQL?
Я не понимаю этого. У меня есть таблица с этими индексами PRIMARY post_id INDEX topic_id FULLTEXT post_text Таблица имеет (только) 346 000 строк. Я пытаюсь выполнить 2 запроса. SELECT post_id FROM phpbb_posts WHERE topic_id = 144017 AND post_id != 155352 AND MATCH(post_text) AGAINST('http://rapidshare.com/files/5494794/photo.rar') занимает 4,05 секунды SELECT post_id FROM phpbb_posts …

1
Поддерживает ли SQL Server 2014 Express с расширенными службами полнотекстовый поиск?
Я установил SQL Server 2014 Express Edition с расширенными сервисами. Я надеялся опробовать функции полнотекстового поиска. Я прочитал здесь, что полнотекстовый поиск поддерживается экспресс-выпуском 2014 года. Но после установки и попытки создания полнотекстового индекса я получаю сообщение об ошибке, в котором говорится, что полнотекстовые индексы не поддерживаются в этой версии …

1
Где находятся полнотекстовые индексы в SSMS 2008 R2
Я без проблем создал новую базу данных, несколько таблиц, полнотекстовый индекс и каталог, используя SQL Server Management Studio. Я хотел скопировать сценарии создания T-SQL для каждого из них, чтобы включить их в мою документацию. Я могу получить сценарии создания базы данных, таблиц, внешних ключей и каталога, но не могу найти …

2
Медленный ЗАКАЗ ПО ЛИМИТУ
У меня есть этот запрос: SELECT * FROM location WHERE to_tsvector('simple',unaccent2("city")) @@ to_tsquery('simple',unaccent2('wroclaw')) order by displaycount Я рада этому: "Sort (cost=3842.56..3847.12 rows=1826 width=123) (actual time=1.915..2.084 rows=1307 loops=1)" " Sort Key: displaycount" " Sort Method: quicksort Memory: 206kB" " -> Bitmap Heap Scan on location (cost=34.40..3743.64 rows=1826 width=123) (actual time=0.788..1.208 rows=1307 …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.