Вопросы с тегом «parsing»

Анализ (не) структурированных данных для преобразования их в структурированный, нормализованный формат.

5
Получение данных с веб-страницы стабильным и эффективным способом
Недавно я узнал, что использование регулярного выражения для анализа HTML-кода веб-сайта для получения необходимых данных - не лучший способ действий. Поэтому мой вопрос прост: что же является лучшим / наиболее эффективным и в целом стабильным способом получения этих данных? Я должен отметить, что: Там нет API Нет другого источника, откуда …
11 data  parsing 

7
Методы парсинга XML
Я всегда считал, что XML довольно сложно обрабатывать. Я не говорю о реализации парсера XML: я говорю об использовании существующего потокового парсера, такого как парсер SAX, который обрабатывает XML узел за узлом. Да, действительно легко изучить различные API для этих синтаксических анализаторов, но всякий раз, когда я смотрю на код, …

2
Алгоритм форматирования кода SQL
Мне нужен инструмент (для внутреннего использования), который будет форматировать код SQL (SQL Server / MySQL). Существуют различные сторонние инструменты и веб-сайты, которые делают это, но не совсем так, как мне это нужно. Поэтому я хочу написать свой собственный инструмент, который будет соответствовать моим потребностям. Первый вопрос: существует ли какой-либо стандарт …

1
Почему GCC переключился с Bison на парсер рекурсивного спуска для C ++ и C?
Было ли изменение языка, которое требовало этого, или какая-то практическая причина, по которой Бизон больше не был подходящим или оптимальным? Я видел в википедии, что они переключились, ссылаясь на примечания к выпуску GCC 3.4 и GCC 4.1 . Эти примечания к выпуску гласят: Рукописный синтаксический анализатор C ++ с рекурсивным …
10 c++  c  parsing  compiler 

1
Влияет ли грамматика бизона GPL на мое приложение?
Я думаю об использовании грамматики GPL Bison для моего собственного компилятора. Будет ли грамматика «заражать» мой синтаксический анализатор таким образом, что он должен быть открытым исходным кодом? Грамматика - с точки зрения - ввод бизона GPL.

3
Написание компилятора - понимание использования и возможностей
Это часть серии вопросов, посвященных проекту, связанному с проектом Abstraction Project, целью которого является абстракция концепций, используемых в языковом дизайне, в форме фреймворка. Родственный проект называется OILexer, целью которого является создание синтаксического анализатора из файлов грамматики без использования внедрения кода в совпадениях. Некоторые другие страницы, связанные с этими вопросами, связанные …

2
Разбор языка для поиска важных слов
Я ищу некоторый вклад и теорию о том, как подходить к лексической теме. Допустим, у меня есть коллекция строк, которая может состоять из одного или нескольких предложений. Я хотел бы проанализировать эти строки и вырвать наиболее важные слова, возможно, с оценкой, которая указывает, насколько вероятно, что слово должно быть важным. …

3
Что такое реальный вариант использования грамматики Chomsky Type-I (контекстно-зависимой)
В последнее время мне было весело исследовать разработку синтаксических анализаторов языка в контексте того, как они вписываются в иерархию Хомского. Что является хорошим реальным (то есть не теоретическим) примером контекстно-зависимой грамматики?

4
Как мне реализовать приложение для обработки команд?
Я хочу создать простое приложение для проверки концепции (REPL), которое принимает число, а затем обрабатывает команды для этого числа. Пример: я начинаю с 1. Затем я пишу " add 2", это дает мне 3. Затем я пишу " multiply 7", это дает мне 21. Затем я хочу знать, если это …

6
Лучший способ разобрать файл
Я пытаюсь найти лучшее решение для создания парсера для некоторых известных форматов файлов, таких как: EDIFACT и TRADACOMS . Если вы не знакомы с этими стандартами, посмотрите этот пример из Википедии: Ниже приведен пример сообщения EDIFACT, используемого для ответа на запрос доступности продукта: - UNA:+.? ' UNB+IATB:1+6XPPC+LHPPC+940101:0950+1' UNH+1+PAORES:93:1:IA' MSG+1:45' IFT+3+XYZCOMPANY …

1
Что делает некоторые вещи проще для анализа, чем другие?
Я только что прочитал страницу Википедии для WebAssembly и там написано: « WebAssembly… предназначен для более быстрого анализа, чем JavaScript », и это заставило меня задуматься о том, что делает определенный язык или формат данных более быстрым для анализа, чем другие, и каковы алгоритмы синтаксического анализа используемый?
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.