Вы можете написать часть программного обеспечения для:
- Возьмите ключевые слова из регулярного выражения;
- Google ключевые слова и получить список результатов;
- Просканируйте каждый полученный URI и отфильтруйте его с помощью полного регулярного выражения.
Давайте изучим случай: site:gog.com
найдем все игры, в которых есть испанский голос за кадром.
Регулярное выражение:
Audio[^:]*:[^.,]*Spanish
Это должно соответствовать, например:
Audio lanuage: English, German, Spanish, French.
И не совпадают
Audio language: only-English. Text language: Spanish.
Шаг 1. Пусть ваше программное обеспечение ищет это в Google:
site:gog.com audio Spanish inurl:game
inurl:game
здесь означает только поиск по страницам описания игры
Шаг 2. Получите 300 результирующих ссылок и просмотрите каждую из них.
Шаг 3. Фильтруйте результат по заданному регулярному выражению:
Audio[^:]*:[^.,]*Spanish
Это должно быть легко построить. На самом деле я не понимаю, почему я не смог найти то, что уже построено таким образом.
Поскольку поисковые системы не могут позволить ресурсу сканировать свои данные с помощью регулярных выражений, эта грязная работа ложится на вас, и ваш компьютер должен делать это с помощью того, что поисковые системы уже предоставляют.