Как обрезать изображение в OpenCV с помощью Python


234

Как я могу обрезать изображения, как я делал это раньше в PIL, используя OpenCV.

Рабочий пример на PIL

im = Image.open('0.png').convert('L')
im = im.crop((1, 1, 98, 33))
im.save('_0.png')

Но как я могу сделать это на OpenCV?

Вот что я попробовал:

im = cv.imread('0.png', cv.CV_LOAD_IMAGE_GRAYSCALE)
(thresh, im_bw) = cv.threshold(im, 128, 255, cv.THRESH_OTSU)
im = cv.getRectSubPix(im_bw, (98, 33), (1, 1))
cv.imshow('Img', im)
cv.waitKey(0)

Но это не работает.

Я думаю, что неправильно использовал getRectSubPix. Если это так, пожалуйста, объясните, как я могу правильно использовать эту функцию.

Ответы:


529

Это очень просто. Используйте нарезанный кусочек.

import cv2
img = cv2.imread("lenna.png")
crop_img = img[y:y+h, x:x+w]
cv2.imshow("cropped", crop_img)
cv2.waitKey(0)

9
Хм ... Но как я могу сохранить изображение в переменную?
Нолик

56
помните, что x и y перевернуты. Я пропустил это.
Маркроксор

10
В качестве альтернативы, если вы определили поле для обрезки, вы можете сделатьcrop_img = img[margin:-margin, margin:-margin]
Руфус

39
Это здорово, просто знайте, что изменение crop_img изменит img. В противном случае вам следует crop_img = img [y: y + h, x: x + w] .copy ()
user1270710

1
@javadba numpy подробности реализации. Numpy использует ряд, col обозначение вместо col, row
Froyo

121

у меня был этот вопрос и я нашел другой ответ здесь: скопируйте область интереса

Если мы рассмотрим (0,0) как верхний левый угол изображения, называемый imслева направо как направление x и сверху вниз как направление y. и мы имеем (x1, y1) как верхнюю левую вершину и (x2, y2) как нижнюю правую вершину области прямоугольника в этом изображении, тогда:

roi = im[y1:y2, x1:x2]

Вот исчерпывающий ресурс по индексированию и разрезанию массива, который может рассказать вам больше о таких вещах, как обрезка части изображения. изображения будут храниться в виде массива в opencv2.

:)


Привет, разве это не должно быть `roi = im [y1: y2 + 1, x1: x2 + 1]` в ваших обстоятельствах? Потому что NumPy использует исключенную область для нарезки.
Скотт Ян

@ samkhan13, когда я обрезаю по этой формуле, все мои обрезки имеют форму (0, ширина, каналы). То есть. Я не получаю
никакого

@ mLstudent33 вероятно, что изображение imбыло прочитано неправильно и является пустым. попробуйте использовать IDE с точками останова для пошаговой диагностики вашего кода. вы можете использовать Google Colab для создания блоков кода и поделиться своей записной книжкой jupytor в чат-комнате stackoverflow, чтобы получить помощь от кого-то.
samkhan13

@ samkhan13 на самом деле у меня есть странная проблема, которую я опубликовал на Github Opencv Issues: github.com/opencv/opencv/issues/15406 Я также проверю чат. Спасибо!
mLstudent33

16

Обратите внимание, что нарезка изображения не создает копию, cropped imageа создает pointerдля roi. Если вы загружаете так много изображений, обрезаете соответствующие части изображений с нарезкой, а затем добавляете их в список, это может привести к огромным потерям памяти.

Предположим, вы загружаете N изображений, >1MPи вам нужна только 100x100область из верхнего левого угла.

Slicing:

X = []
for i in range(N):
    im = imread('image_i')
    X.append(im[0:100,0:100]) # This will keep all N images in the memory. 
                              # Because they are still used.

Кроме того, вы можете скопировать соответствующую часть .copy(), так что сборщик мусора удалит im.

X = []
for i in range(N):
    im = imread('image_i')
    X.append(im[0:100,0:100].copy()) # This will keep only the crops in the memory. 
                                     # im's will be deleted by gc.

Узнав об этом, я понял, что один из комментариев пользователя user1270710 упомянул это, но мне потребовалось довольно много времени, чтобы выяснить это (т.е. отладка и т. Д.) Так что, думаю, стоит упомянуть.



В смысле занимаемой памяти, я понимаю, что лучше всего копировать интересующую область, но как насчет затрат времени? Если я сделаю copy()окупаемость инвестиций, по сравнению с нарезкой, каков будет результат? Кроме того, если у меня есть переменная, tmpв которой я сохраняю каждое изображение, загружаемое с моего компьютера, нарезка не должна плохо влиять на мою память, верно? Проблема, которую вы описываете, связана только с тем, что происходит, когда вы загружаете все изображения, а затем снова сохраняете их ROI с оригиналами и ROI . Пожалуйста, дайте мне знать, если я правильно понял.
Кэтэлина Сырбу

Копирование будет незначительным временем в случае, который я сказал. Если вы не копируете большие изображения так много раз, у вас не будет разницы во времени. В моем коде эффект будет меньше 1 мс на обрезку. Проблема в том, что вы либо храните большое изображение и указатель (ROI, который составляет всего несколько байтов), либо вы сохраняете небольшое изображение в памяти (в моем случае). Если вы сделаете это несколько раз, это нормально. Однако, если вы сделаете это тысячи раз, использование памяти будет сумасшедшим с нарезкой. Как вы заполняете всю память после пары тысяч загрузок изображений, если вы делаете нарезку. В то время как мой код все еще будет в порядке, если МБ
smttsp

12

этот код обрезает изображение с позиции x = 0, y = 0 до h = 100, w = 200

import numpy as np
import cv2

image = cv2.imread('download.jpg')
y=0
x=0
h=100
w=200
crop = image[y:y+h, x:x+w]
cv2.imshow('Image', crop)
cv2.waitKey(0) 

@hatami, так что высота на 100 пикселей "ниже", у = 0, верно? Это 101-й ряд массивов NumPy? И ширина 200 пикселей справа от x = 0 правильная?
mLstudent33

4

Ниже приведен способ обрезки изображения.

image_path: путь к изображению для редактирования

Координаты: кортеж координат x / y (x1, y1, x2, y2) [откройте изображение в mspaint и проверьте «линейку» на вкладке вида, чтобы увидеть координаты]

save_location : путь для сохранения обрезанного изображения

from PIL import Image
    def crop(image_path, coords, saved_location:
        image_obj = Image.open("Path of the image to be cropped")
            cropped_image = image_obj.crop(coords)
            cropped_image.save(saved_location)
            cropped_image.show()


if __name__ == '__main__':
    image = "image.jpg"
    crop(image, (100, 210, 710,380 ), 'cropped.jpg')

3

Надежная обрезка с функцией копирования границы opencv:

def imcrop(img, bbox):
   x1, y1, x2, y2 = bbox
   if x1 < 0 or y1 < 0 or x2 > img.shape[1] or y2 > img.shape[0]:
        img, x1, x2, y1, y2 = pad_img_to_fit_bbox(img, x1, x2, y1, y2)
   return img[y1:y2, x1:x2, :]

def pad_img_to_fit_bbox(img, x1, x2, y1, y2):
    img = cv2.copyMakeBorder(img, - min(0, y1), max(y2 - img.shape[0], 0),
                            -min(0, x1), max(x2 - img.shape[1], 0),cv2.BORDER_REPLICATE)
   y2 += -min(0, y1)
   y1 += -min(0, y1)
   x2 += -min(0, x1)
   x1 += -min(0, x1)
   return img, x1, x2, y1, y2

Не могли бы вы объяснить, что такое bbox здесь и что мы должны придавать его значению, потому что, какое бы значение я ни пытался передать, оно дает мне ошибку, x1,y1,x2,y2 = bbox когда я говорю:TypeError: 'int' object is not iterable
Sabah

3

вот некоторый код для более надежного imcrop (немного похоже на matlab)

def imcrop(img, bbox): 
    x1,y1,x2,y2 = bbox
    if x1 < 0 or y1 < 0 or x2 > img.shape[1] or y2 > img.shape[0]:
        img, x1, x2, y1, y2 = pad_img_to_fit_bbox(img, x1, x2, y1, y2)
    return img[y1:y2, x1:x2, :]

def pad_img_to_fit_bbox(img, x1, x2, y1, y2):
    img = np.pad(img, ((np.abs(np.minimum(0, y1)), np.maximum(y2 - img.shape[0], 0)),
               (np.abs(np.minimum(0, x1)), np.maximum(x2 - img.shape[1], 0)), (0,0)), mode="constant")
    y1 += np.abs(np.minimum(0, y1))
    y2 += np.abs(np.minimum(0, y1))
    x1 += np.abs(np.minimum(0, x1))
    x2 += np.abs(np.minimum(0, x1))
    return img, x1, x2, y1, y2

1

В качестве альтернативы вы можете использовать тензорный поток для обрезки и openCV для создания массива из изображения.

import cv2
img = cv2.imread('YOURIMAGE.png')

Теперь imgэто (imageheight, imagewidth, 3) массив форм. Обрезать массив с помощью тензорного потока:

import tensorflow as tf
offset_height=0
offset_width=0
target_height=500
target_width=500
x = tf.image.crop_to_bounding_box(
    img, offset_height, offset_width, target_height, target_width
)

Соберите изображение с помощью tf.keras, чтобы мы могли посмотреть на него, если оно сработало:

tf.keras.preprocessing.image.array_to_img(
    x, data_format=None, scale=True, dtype=None
)

Это распечатывает изображение в блокноте (проверено в Google Colab).


Весь код вместе:

import cv2
img = cv2.imread('YOURIMAGE.png')

import tensorflow as tf
offset_height=0
offset_width=0
target_height=500
target_width=500
x = tf.image.crop_to_bounding_box(
    img, offset_height, offset_width, target_height, target_width
)

tf.keras.preprocessing.image.array_to_img(
    x, data_format=None, scale=True, dtype=None
)
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.