Можно ли искать сайты MediaWiki с помощью регулярных выражений?


9

Я хотел бы искать фразы с использованием регулярных выражений на таких сайтах, как Wikipedia и Wikimedia Commons. Можно ли сделать это?

Пример поискового запроса regex: (facebook | google) (корпоративная история | веб-сайты)

Уже можно сделать то же самое в Google ( как показано здесь ), поэтому я хочу знать, возможно ли это и для Википедии.


Желаете ли вы загрузить несколько гигабайт данных и выполнить всю фильтрацию на своем компьютере?
svick

Похоже, что это можно сделать с помощью AutoWikiBrowser: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/…
Андерсон Грин,

Вы можете использовать AWB для поиска определенной страницы (или набора страниц), но не всей вики, что, как я предполагал, - это то, что вы хотели.
svick

Да, я хотел обыскать всю вики. Есть ли на сервере инструментов какие-либо инструменты для этого?
Андерсон Грин

Ответы:


3

Можно искать в Википедии (или на любом другом сайте, к которому может обращаться поисковая система), используя простые регулярные выражения, если вы полагаетесь на поисковую систему. Следующий поисковый запрос Google ищет в Википедии совпадения с регулярным выражением (Yahoo|Google|Microsoft):

https://www.google.com/#hl=en&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + Yahoo + или + Microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0,0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & = 1 PBX & БАВ = на 0,2, or.r_cp.r_qf. & BVM = bv.44158598, d.dmg & Fp = dc8abc04c054405e & BIW = 1366 & БиГ = 639



2

Он доступен и поддерживается CirrusSearch (на основе ElasticSearch ), который используется поисковой системой на сайтах MediaWiki и платформой Wikimedia.

Некоторые примеры использования:

Примечание: полный справочник и источник - в Википедии: Справка: Поиск # Search_string_syntax .

Что касается вашего вопроса:

Логические операторы

Поисковая система поддерживает булеву логику в поиске. Логические операторы включают символ «-» (знак минус) для «логического не», скобки «И», «ИЛИ» и скобки для группировки: (_).

Логическое ИЛИ должно быть написано заглавными буквами; Оператор И предполагается для всех членов (разделенных пробелами), но заглавная И эквивалентна.

Больше примеров:

  • Просто AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- будет работать, как ожидалось.
  • Суффикс тильды для нечеткого поиска ( «звучит как») - Например, поиск charlie~ parker~возвратов Charlie Parker, Charles Palmer, Charley Parks(до двух символов разницы, не считая первый).
  • Поиск по шаблону - поиск face*e- начинается с faceи заканчивается eчем-то посередине. введите описание изображения здесь

Дополнительное чтение

Узнайте больше о поисковой системе и этом расширении, чтобы раскрыть их полную функциональность и возможности.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.