Как прочитать значение RGB данного пикселя в Python?


146

Если я открываю изображение с помощью open("image.jpg"), как я могу получить значения RGB пикселя, если у меня есть координаты пикселя?

Тогда как я могу сделать наоборот? Начав с пустого графического изображения, «напишите» пиксель с определенным значением RGB?

Я бы предпочел, чтобы мне не приходилось скачивать дополнительные библиотеки.

Ответы:


220

Вероятно, для этого лучше всего использовать библиотеку изображений Python, которая, я боюсь, загружается отдельно.

Самый простой способ сделать то, что вы хотите, - использовать метод load () для объекта Image, который возвращает объект доступа к пикселям, которым вы можете управлять как массивом:

from PIL import Image

im = Image.open('dead_parrot.jpg') # Can be many different formats.
pix = im.load()
print im.size  # Get the width and hight of the image for iterating over
print pix[x,y]  # Get the RGBA Value of the a pixel of an image
pix[x,y] = value  # Set the RGBA Value of the image (tuple)
im.save('alive_parrot.png')  # Save the modified pixels as .png

Как вариант, посмотрите ImageDraw, который предоставляет гораздо более богатый API для создания изображений.


1
К счастью, установка PIL очень проста в Linux и Windows (не знаю о Mac)
heltonbiker

7
@ArturSapek, я установил PIL, с помощью pipкоторого было довольно просто.
michaelliu

1
Я использовал это на своем Mac (Pypi):easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
Mazyod

17
Для будущих читателей: pip install pillowустановит PIL успешно и довольно быстро (может понадобиться, sudoесли не в virtualenv).
Кристофер Шроба

Pillow.readthedocs.io/en/latest/… показывает команды bash в шагах установки Windows. Не знаю, как действовать дальше.
Musixauce3000

37

Используя Pillow (который работает с Python 3.X, а также с Python 2.7+), вы можете делать следующее:

from PIL import Image
im = Image.open('image.jpg', 'r')
width, height = im.size
pixel_values = list(im.getdata())

Теперь у вас есть все значения пикселей. Если это RGB или другой режим может быть прочитан im.mode. Тогда вы можете получить пиксель (x, y):

pixel_values[width*y+x]

В качестве альтернативы вы можете использовать Numpy и изменить форму массива:

>>> pixel_values = numpy.array(pixel_values).reshape((width, height, 3))
>>> x, y = 0, 1
>>> pixel_values[x][y]
[ 18  18  12]

Полное, простое в использовании решение

# Third party modules
import numpy
from PIL import Image


def get_image(image_path):
    """Get a numpy array of an image so that one can access values[x][y]."""
    image = Image.open(image_path, "r")
    width, height = image.size
    pixel_values = list(image.getdata())
    if image.mode == "RGB":
        channels = 3
    elif image.mode == "L":
        channels = 1
    else:
        print("Unknown mode: %s" % image.mode)
        return None
    pixel_values = numpy.array(pixel_values).reshape((width, height, channels))
    return pixel_values


image = get_image("gradient.png")

print(image[0])
print(image.shape)

Дымовое тестирование кода

Вы можете не знать порядка ширины / высоты / канала. По этой причине я создал этот градиент:

введите описание изображения здесь

Изображение имеет ширину 100 пикселей и высоту 26 пикселей. Он имеет цветовой градиент от #ffaa00(желтого) до #ffffff(белого). Результат:

[[255 172   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   4]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]]
(100, 26, 3)

На заметку:

  • Форма (ширина, высота, каналы)
  • Следовательно image[0], в первом ряду 26 троек одного цвета.

Pillow поддерживает python 2.7 на macosx, в то время как я нахожу поддержку python 2.5 только на PIL. Благодарность!
Kangaroo.H

2
Будьте осторожны, список параметров изменения формы должен быть (высота, ширина, каналы). а для изображений rgba вы можете включить image.mode = RGBA с каналами = 4
gmarsi

Верно ли утверждение @gmarsi о ширине и высоте? Неужели оба действительны? Вы должны знать, как выводятся данные, чтобы знать, какую форму будет иметь выходной массив и где будут находиться пиксельные данные строки и столбца изображения.
Киошики

@Kioshiki Я добавил в свой ответ раздел "дымовое тестирование", чтобы было легче сказать.
Мартин Тома,

24

PyPNG - легкий декодер / кодировщик PNG

Хотя вопрос намекает на JPG, я надеюсь, что мой ответ будет кому-то полезен.

Вот как читать и записывать пиксели PNG с помощью модуля PyPNG :

import png, array

point = (2, 10) # coordinates of pixel to be painted red

reader = png.Reader(filename='image.png')
w, h, pixels, metadata = reader.read_flat()
pixel_byte_width = 4 if metadata['alpha'] else 3
pixel_position = point[0] + point[1] * w
new_pixel_value = (255, 0, 0, 0) if metadata['alpha'] else (255, 0, 0)
pixels[
  pixel_position * pixel_byte_width :
  (pixel_position + 1) * pixel_byte_width] = array.array('B', new_pixel_value)

output = open('image-with-red-dot.png', 'wb')
writer = png.Writer(w, h, **metadata)
writer.write_array(output, pixels)
output.close()

PyPNG - это единственный чистый модуль Python длиной менее 4000 строк, включая тесты и комментарии.

PIL - это более полная библиотека изображений, но она также значительно тяжелее.


11

Как сказал Дэйв Уэбб:

Вот мой рабочий фрагмент кода, печатающий цвета пикселей из изображения:

import os, sys
import Image

im = Image.open("image.jpg")
x = 3
y = 4

pix = im.load()
print pix[x,y]

6
photo = Image.open('IN.jpg') #your image
photo = photo.convert('RGB')

width = photo.size[0] #define W and H
height = photo.size[1]

for y in range(0, height): #each pixel has coordinates
    row = ""
    for x in range(0, width):

        RGB = photo.getpixel((x,y))
        R,G,B = RGB  #now you can use the RGB value

3

Обработка изображения является сложной задачей , и это лучше всего, если вы действительно используете библиотеку. Я могу порекомендовать gdmodule, который обеспечивает легкий доступ ко многим различным форматам изображений из Python.


Кто-нибудь знает, почему это было отклонено? Есть известная проблема с libgd или чем-то еще? (Я никогда не смотрел на это, но всегда приятно знать, что есть альтернатива PiL)
Питер Хэнли

3

На wiki.wxpython.org есть действительно хорошая статья « Работа с изображениями» . В статье упоминается возможность использования wxWidgets (wxImage), PIL или PythonMagick. Лично я использовал PIL и wxWidgets, и оба они упрощают работу с изображениями.


3

Вы можете использовать модуль surfarray pygame . В этом модуле есть метод возврата массива 3D пикселей, который называется pixel3d (surface). Я показал использование ниже:

from pygame import surfarray, image, display
import pygame
import numpy #important to import

pygame.init()
image = image.load("myimagefile.jpg") #surface to render
resolution = (image.get_width(),image.get_height())
screen = display.set_mode(resolution) #create space for display
screen.blit(image, (0,0)) #superpose image on screen
display.flip()
surfarray.use_arraytype("numpy") #important!
screenpix = surfarray.pixels3d(image) #pixels in 3d array:
#[x][y][rgb]
for y in range(resolution[1]):
    for x in range(resolution[0]):
        for color in range(3):
            screenpix[x][y][color] += 128
            #reverting colors
screen.blit(surfarray.make_surface(screenpix), (0,0)) #superpose on screen
display.flip() #update display
while 1:
    print finished

Надеюсь, это было полезно. Последнее слово: экран заблокирован на время жизни скринпикс.


2

установите PIL с помощью команды «sudo apt-get install python-imaging» и запустите следующую программу. Он напечатает значения RGB изображения. Если изображение большое, перенаправьте вывод в файл с помощью '>', позже откройте файл, чтобы увидеть значения RGB.

import PIL
import Image
FILENAME='fn.gif' #image can be in gif jpeg or png format 
im=Image.open(FILENAME).convert('RGB')
pix=im.load()
w=im.size[0]
h=im.size[1]
for i in range(w):
  for j in range(h):
    print pix[i,j]

2

Вы можете использовать модуль Tkinter, который является стандартным интерфейсом Python для набора инструментов Tk GUI, и вам не нужна дополнительная загрузка. См. Https://docs.python.org/2/library/tkinter.html .

(Для Python 3 Tkinter переименован в tkinter)

Вот как установить значения RGB:

#from http://tkinter.unpythonic.net/wiki/PhotoImage
from Tkinter import *

root = Tk()

def pixel(image, pos, color):
    """Place pixel at pos=(x,y) on image, with color=(r,g,b)."""
    r,g,b = color
    x,y = pos
    image.put("#%02x%02x%02x" % (r,g,b), (y, x))

photo = PhotoImage(width=32, height=32)

pixel(photo, (16,16), (255,0,0))  # One lone pixel in the middle...

label = Label(root, image=photo)
label.grid()
root.mainloop()

И получаем RGB:

#from http://www.kosbie.net/cmu/spring-14/15-112/handouts/steganographyEncoder.py
def getRGB(image, x, y):
    value = image.get(x, y)
    return tuple(map(int, value.split(" ")))

2
from PIL import Image
def rgb_of_pixel(img_path, x, y):
    im = Image.open(img_path).convert('RGB')
    r, g, b = im.getpixel((x, y))
    a = (r, g, b)
    return a

1
Хотя этот фрагмент кода может быть решением, включение объяснения действительно помогает улучшить качество вашего сообщения. Помните, что вы отвечаете на вопрос читателей в будущем, и эти люди могут не знать причин вашего предложения кода.
Narendra Jadhav

1
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

img=mpimg.imread('Cricket_ACT_official_logo.png')
imgplot = plt.imshow(img)

1

Если вы хотите иметь три цифры в виде цветового кода RGB, следующий код должен именно это сделать.

i = Image.open(path)
pixels = i.load() # this is not a list, nor is it list()'able
width, height = i.size

all_pixels = []
for x in range(width):
    for y in range(height):
        cpixel = pixels[x, y]
        all_pixels.append(cpixel)

Это может сработать для вас.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.