Skip to content

Whiox/TargetCloudDetect

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TargetCloudDetect

Python-библиотека для автоматического определения подходящей точки на изображении и размещения графического элемента относительно найденной области.

Проект создан для команды моего бота: discord-wlf

Как это работает

В основе используется модель на базе EfficientNet.

Изображение приводится к размеру 224 × 224, после чего модель формирует сетку признаков 7 × 7. Для каждой ячейки предсказываются:

  • смещение точки по оси X;
  • смещение точки по оси Y;
  • уверенность в наличии целевого объекта.

Ячейка с максимальной уверенностью используется для восстановления координат на исходном изображении.

Модель обучена на вручную собранном и размеченном датасете.

Возможности

  • определение координат целевой области;
  • получение оценки уверенности модели;
  • обработка изображений из файла или массива байтов;
  • автоматическое размещение облака ответа;
  • готовые веса входят в состав пакета;

Установка

pip install git+https://github.com/Whiox/TargetCloudDetect.git

Использование

Получение координат

from PIL import Image
from target_cloud_detect import Model

model = Model()
image = Image.open("image.png")

x, y, confidence = model.predict_x_y_conf(image)

print(f"Координаты: {x}, {y}")
print(f"Уверенность: {confidence:.2%}")

Обработка файла

from target_cloud_detect import Model

model = Model()
result = model.predict_from_file("image.png")
result.save("result.png")

Обработка массива байтов

from target_cloud_detect import Model

model = Model()

with open("image.png", "rb") as file:
    result = model.predict_from_bytes(file.read())

result.save("result.png")

Собственные веса можно передать при создании модели:

model = Model("path/to/model.keras")

Обучение

Блокнот с архитектурой и процессом обучения модели доступен в Google Colab

Стек

  • Python
  • Keras
  • TensorFlow
  • EfficientNet
  • NumPy
  • Pillow

About

Модель на базе EfficientNet для поиска целевой точки на изображении и автоматического размещения speech bubble.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages