Вопросы с тегом «full-text-search»

Поиск в тексте коллекции документов или полей свободного текста в базе данных, чтобы найти те, которые содержат слово или комбинацию слов.

2
Обновление запросов происходит медленнее после включения полнотекстового индекса SQL Server
У меня есть веб-сайт asp.net со множеством запросов на вставку, обновление и удаление, работающих с моей базой данных. Несколько дней назад я создал полнотекстовый индекс по двум столбцам одной из таблиц. После этого я понял, что, когда веб-сайт выполняет запросы на обновление этой таблицы, использование памяти и диска процесса SQL …

2
Медленный полнотекстовый поиск из-за крайне неточных оценок строк
Полнотекстовые запросы к этой базе данных (хранение билетов RT ( Request Tracker )) выполняются очень долго. Таблица вложений (содержащая полнотекстовые данные) составляет около 15 ГБ. Схема базы данных выглядит следующим образом, это около 2 миллионов строк: rt4 = # \ d + вложения Таблица "public.attachments" Колонка | Тип | Модификаторы …

1
Рассчитать MATCH () ПРОТИВ () баллов по UNIFIED QUERY не ДЛЯ КАЖДОЙ ТАБЛИЦЫ
Я пытаюсь получить оценку для всего раздела утверждений SELECT SELECT *,MATCH(`result`) AGAINST('keyword') as `score` FROM `table1` WHERE MATCH(`result`) AGAINST('keyword') UNION SELECT *,MATCH(`content`) AGAINST('keyword') as `score` FROM `table2` WHERE MATCH(`content`) AGAINST('keyword') UNION SELECT *,MATCH(`text`) AGAINST('keyword') as `score` FROM `table3` WHERE MATCH(`text`) AGAINST('keyword') В таком случае баллы за таблицу + они не …

1
Почему полнотекстовый поиск возвращает меньше строк, чем LIKE
У меня не работает полнотекстовый поиск, как я хочу, и я не понимаю различий в результирующих списках. Пример заявления: SELECT `meldungstext` FROM `artikel` WHERE `meldungstext` LIKE '%punkt%' возвращает 92 строки. Я получаю строки, которые имеют совпадения, например, такие как «Punkten», «Zwei-Punkte-Vorsprung» и «Treffpunkt» в столбце meldungstext. Я установил полнотекстовый индекс …

2
Postgres полнотекстовый поиск с несколькими столбцами, почему Concat в индексе, а не во время выполнения?
В последние несколько дней я сталкивался с полнотекстовым поиском в postgres, и меня немного смущает индексация при поиске по нескольким столбцам. В Postgres документах говорить о создании ts_vectorиндекса на сцепленных столбцах, например , так: CREATE INDEX pgweb_idx ON pgweb USING gin(to_tsvector('english', title || ' ' || body)); который я могу …

2
Лучший подход для «как или нравится, или нравится, или нравится, или нравится»
В этом вопросе у него такая же проблема, как и у меня. Мне нужно что-то вроде: select * from blablabla where product like '%rock%' or like '%paper%' or like '%scisor%' or like '%car%' or like '%pasta%' Это ужасно и не использует индексы. В этом случае это действительно единственный способ сделать …

1
Полнотекстовый: множество FT_MASTER_MERGE ожидает в состоянии SUSPENDED после создания нескольких полнотекстовых индексов (зависание сервера)
Мы провели тестирование на SQL Server 2014, когда у нас было 10 баз данных, 100 различных схем в каждой базе данных, 10 небольших (~ 50 строк) таблиц в каждой схеме (всего 10K таблиц), и мы создали полнотекстовые индексы для всех этих таблицы во всех этих базах данных одновременно. Через несколько …

2
Свойства файлового файла SQL Server
Я использую Filetable для SQL Server 2012 для хранения документов и поиска по ним с помощью семантического поиска . Мне было интересно, если есть способ перечислить все свойства документа (метаданные). Есть способ включить индексирование полнотекстового поиска и поиск по свойствам документа. Я могу составить список свойств индексов SQL Server с …

1
Медленный запрос при наличии «содержит» и «=» в предложении where
Следующий запрос занимает около 10 секунд для завершения таблицы с 12k записей select top (5) * from "Physician" where "id" = 1 or contains("lastName", '"a*"') Но если я изменю предложение where на where "id" = 1 или where contains("lastName", '"a*"') Он вернется мгновенно. Оба столбца проиндексированы, а столбец lastName также …

2
Медленный полнотекстовый поиск по терминам с высокой частотой встречаемости
У меня есть таблица, которая содержит данные, извлеченные из текстовых документов. Данные хранятся в столбце, "CONTENT"для которого я создал этот индекс, используя GIN: CREATE INDEX "File_contentIndex" ON "File" USING gin (setweight(to_tsvector('english'::regconfig , COALESCE("CONTENT", ''::character varying)::text), 'C'::"char")); Я использую следующий запрос для выполнения полнотекстового поиска в таблице: SELECT "ITEMID", ts_rank(setweight(to_tsvector('english', coalesce("CONTENT",'')), …

1
Лучший индекс для функции подобия
Таким образом, у меня есть эта таблица с 6,2 миллионами записей, и я должен выполнить поисковые запросы с подобием для одного столбца. Запросы могут быть: SELECT "lca_test".* FROM "lca_test" WHERE (similarity(job_title, 'sales executive') > 0.6) AND worksite_city = 'los angeles' ORDER BY salary ASC LIMIT 50 OFFSET 0 Дополнительные условия …

1
Объединение полнотекстового и скалярного индекса
Допустим, у нас есть база данных из 12 миллионов имен и адресов, которые необходимо искать с помощью полнотекстового поиска, но каждая строка также содержит целочисленное значение, скажем COMPANYID. Таблица содержит около 250 различных идентификаторов COMPANYID по этим 12 миллионам строк. Можно ли при определении полнотекстовых индексов дать каждой COMPANYсвоей «ветке» …


3
Оптимизация ORDER BY в полнотекстовом поисковом запросе
У меня есть большая таблица entitiesс ~ 15M записей. Я хочу найти топ-5 строк, соответствующих «хоккею» в их name. У меня есть полнотекстовый индекс name, который используется:gin_ix_entity_full_text_search_name Запрос: SELECT "entities".*, ts_rank(to_tsvector('english', "entities"."name"::text), to_tsquery('english', 'hockey'::text)) AS "rank0.48661998202865475" FROM "entities" WHERE "entities"."place" = 'f' AND (to_tsvector('english', "entities"."name"::text) @@ to_tsquery('english', 'hockey'::text)) ORDER BY …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.