Измерение размера объекта с помощью глубокой нейронной сети


10

У меня есть большой набор данных автомобилей с истинной длиной (более 100 тыс. Образцов). Можно ли обучить глубокую сеть для измерения / оценки длины транспортного средства? Я не видел никаких работ, связанных с оценкой размера объекта с помощью глубокой нейронной сети.


1
Очень хороший вопрос Добро пожаловать в AI!
DukeZhou

(Примечание для модератора) - это ответ заполнителя, чтобы задать вопрос OP, так как я не могу комментировать Ваши данные представляют собой изображения или текст? hisairnessag3 находится на правильном пути с переносом подхода «пиксели / метрика» из OpenCV на DNN обнаружения объекта
Adnan S

Ответы:


4

Да! Это наверняка можно сделать. Поскольку у вас есть помеченный набор данных, это делает его еще проще!

Я хотел бы взглянуть на этот проект, и это должно привести вас туда, куда вам нужно идти.

Детали реализации должны быть довольно простыми. Дайте мне знать, если я могу помочь дальше.


1
Нет необходимости объяснять, почему кто-то отказывается от голосования. Многие программисты не имеют достаточно времени, чтобы посмотреть на комментарии, они смотрят на голоса, чтобы увидеть, стоит ответ или нет. Если вы прочитаете вопрос еще раз, вы обнаружите, что речь идет именно об использовании DNN, а не о чем-либо еще. проект, которым вы поделились, об использовании Opencv ... если вы прочитаете комментарии под сообщением, которым вы поделились, вы обнаружите, что люди спрашивают о DNN, но само сообщение не использует DNN. Кстати, я не тот человек, который проголосовал за ваш ответ
BH85

2
Это не обязательно, но полезно. Если вы ищете на любой глубине, вы не найдете никаких проектов или документов по этому конкретному варианту использования для DNN. С учетом вышесказанного, я ссылался на самый близкий проект в надежде начать OP. Дополнительно я ответил на вопрос. Вопрос был в том, можно ли это сделать.
hisairnessag3

Спасибо за Ваш ответ! Я думаю, что это было бы улучшено небольшим объяснением того, как / почему это возможно. По крайней мере, схема архитектуры будет очень полезна.
Бен Н

1

Да, это возможно, но сначала вам нужно будет распознать какой-либо объект на изображении, либо 1) само транспортное средство, а затем сообщить об известном размере этого транспортного средства, либо 2) известный объект, который находится на том же расстоянии от камеры, что и автомобиль ( бордюр, знак остановки, голова водителя, пони из шетландских островов ... что угодно), а затем используйте этот объект для калибровки размера автомобиля, который очень близок к нему.

Любой автомобиль на изображении будет находиться на неизвестном расстоянии от камеры, в результате чего автомобильный объект будет выглядеть больше или меньше от фотографии к фотографии. Если вы не узнаете автомобиль или хотя бы референтный объект, имеющий известный размер, физический размер автомобиля не будет откалиброван - у вас не будет оснований для оценки размера.

Если автомобиль неизвестен, то даже если у вас есть визуальные подсказки (присутствует референтный объект или известно расстояние от камеры до автомобиля), неизвестная степень широкоугольного объектива камеры может исказить форму неизвестного автомобиля (высота против ширины), что еще больше усложняет вашу способность оценивать его видимые размеры.


Может ли номерной знак транспортного средства быть тем известным объектом, который используется для калибровки размера автомобиля? Номерные знаки обычно одинакового размера.
Наджи

1
Вы должны быть осторожны с предположениями о том, что номерные знаки имеют одинаковый размер. Например, австралийская тарелка и американская тарелка разных размеров. Если это не проблема для вашего приложения (оно будет работать только в одной стране), вы можете принять эталонный размер для пластины. Вы должны быть осторожны, потому что тарелка может быть ориентирована не так, как обычно. Если автомобиль находится под углом 45 градусов, ширина пластины будет занимать меньше пикселей, чем при 0, даже на том же расстоянии.
пшлады

1

Я думаю, что эта статья может вам помочь: оценка трехмерных границ с использованием глубокого обучения и геометрии

Он использовал 1 VGG-19 (предварительно обученный на ImageNet), чтобы узнать размеры автомобилей


Как и вы, я предположил, что речь идет о выводе трехмерной ограничительной рамки, в которой данные представлены в двухмерном изображении. Проект, упомянутый hisairnessag3, по-видимому, затрагивает только ограничивающую рамку 2D без какого-либо выученного логического поведения относительно трехмерной природы, которую может содержать изображение.
Джим

Эта статья оценивает размер и ориентацию автомобиля, используя 2D обрезанное изображение (содержит только нужный объект).
cryax dsa
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.