Как фильтровать массив объектов на основе значений во внутреннем массиве с помощью jq?


240

Учитывая этот вклад:

[
  {
    "Id": "cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b",
    "Names": [
      "condescending_jones",
      "loving_hoover"
    ]
  },
  {
    "Id": "186db739b7509eb0114a09e14bcd16bf637019860d23c4fc20e98cbe068b55aa",
    "Names": [
      "foo_data"
    ]
  },
  {
    "Id": "a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19",
    "Names": [
      "jovial_wozniak"
    ]
  },
  {
    "Id": "76b71c496556912012c20dc3cbd37a54a1f05bffad3d5e92466900a003fbb623",
    "Names": [
      "bar_data"
    ]
  }
]

Я пытаюсь создать фильтр с jq, который возвращает все объекты с Ids, которые не содержат «данные» во внутреннем Namesмассиве, с выводом, разделенным символом новой строки. Для приведенных выше данных, я хотел бы получить

cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19

Я думаю, что я несколько близок с этим:

(. - select(.Names[] contains("data"))) | .[] .Id

но selectфильтр не корректен и не компилируется (получается error: syntax error, unexpected IDENT).

Ответы:


372

Очень близко! В вашем selectвыражении вы должны использовать pipe ( |) раньше contains.

Этот фильтр производит ожидаемый результат.

. - map(select(.Names[] | contains ("data"))) | .[] .Id

JQ Поваренная есть пример синтаксиса.

Фильтровать объекты по содержанию ключа

Например, я хочу только объекты, ключ жанра которых содержит «дом».

$ json='[{"genre":"deep house"}, {"genre": "progressive house"}, {"genre": "dubstep"}]'
$ echo "$json" | jq -c '.[] | select(.genre | contains("house"))'
{"genre":"deep house"}
{"genre":"progressive house"}

Колин Д. спрашивает, как сохранить структуру JSON массива, чтобы конечный результат представлял собой один массив JSON, а не поток объектов JSON.

Самый простой способ - обернуть все выражение в конструктор массива:

$ echo "$json" | jq -c '[ .[] | select( .genre | contains("house")) ]'
[{"genre":"deep house"},{"genre":"progressive house"}]

Вы также можете использовать функцию карты:

$ echo "$json" | jq -c 'map(select(.genre | contains("house")))'
[{"genre":"deep house"},{"genre":"progressive house"}]

Карта распаковывает входной массив, применяет фильтр к каждому элементу и создает новый массив. Другими словами, map(f)эквивалентно [.[]|f].


Спасибо, отлично работает! Я действительно видел этот пример, но мне просто не удалось адаптировать его к моему сценарию :-)
Abe Voelker

1
Есть ли способ «сохранить структуру массива json»? Мне нравится пример жанра, но он выводит две "линии json". Я не мог выяснить часть карты обязательно
Колин Д.

4
@ColinD Я был не очень доволен решением сокращения, поэтому я заменил его объяснением функции карты. Это помогает?
Иэн Сэмюэл Маклин, старейшина

@IainElder - Что происходит, когда часть поискового запроса (в данном случае house) является переменной? Так скажем, используя --args термин se. Так содержится («hou $ term»)
SnazzyBootMan

@Chris Переменная $termбудет восприниматься как строка, поэтому вам следует использовать конкатенацию строк:contains("hou" + $term)
Iain Samuel McLean Elder

17

Вот еще одно решение, которое использует любой / 2

map(select(any(.Names[]; contains("data"))|not)|.Id)[]

с образцом данных и -rопцией, которую он производит

cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19

Именно то, что я искал - почему это работает с точкой с запятой, .Names[] ; contains()а не с трубкой .Names[] | contains()?
Мэтт

3
Ах, это any(generator; condition)форма. Я обнаружил, что без использования any()я получу дубликаты в моих результатах, если они будут select()совпадать с одним и тем же объектом более одного раза.
Мэтт
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.