Вы можете взять их -pages-articles.xml.bz2
с сайта дампов Викимедиа и обработать их с помощью WikiTaxi (скачать в левом верхнем углу). Инструмент импорта Wikitaxi создаст .taxi
файл (около 15 Гб для Википедии) из.bz2
файла. Этот файл будет использоваться программой WikiTaxi для поиска статей. Опыт очень похож на опыт браузера.
Или вы можете использовать Kiwix , быстрее настроить, потому что он также предоставляет уже обработанные дампы ( .zim
файлы). Поскольку в комментарии указано, что можно использовать другие сайты MediaWiki для kiwix mwoffliner
, он может работать не со всеми, поскольку они могут иметь собственные различия, но это единственный вариант, с которым я столкнулся.
Брать вещи с Викимедиа wget
не очень хорошая практика. Если слишком много людей сделают это, это может затопить сайты запросами.
Позже отредактируйте для случая, если вы хотите также изображения в автономном режиме:
Если вы хотите полностью отразить полное форматирование HTML в Википедии (включая изображения), которое будет загружено примерно через 30 часов , вы должны использовать:
Английская Википедия имеет много данных. Есть более 13,9 миллионов страниц с более чем 20,0 ГБ текста, а также более 3,7 миллиона миниатюр.
XOWA :
Настройка всего этого на вашем компьютере не будет быстрым процессом ... Для самого импорта потребуется 80 ГБ дискового пространства и пять часов для обработки текстовой версии. Если вам нужны изображения, их число увеличивается до 100 ГБ на диске и 30 часов времени обработки. Однако, когда вы закончите, у вас будет полная, свежая копия английской Википедии с изображениями, которые могут поместиться на SD-карту 128 ГБ.
Но автономная версия очень похожа на онлайн-версию, включает фотографии и т. Д.
(Я проверил нижеприведенную статью полностью в автономном режиме)
Позже отредактируйте, если ничего из вышеперечисленного не применимо:
Если вики не является частью Викимедиа или не имеют дампа, на github есть проект, который загружает эту вики с помощью ее API:
Main Page
и перейдите по ссылкам оттуда.