
回复
本文档基于瑞芯微RV1106的LockAI凌智视觉识别模块,通过C++语言做的目标检测实验。
本文档展示了如何使用 lockzhiner_vision_module::vision::PaddleDet 类进行目标检测,并通过
lockzhiner_vision_module::vision::Visualize 函数将检测结果可视化。
源代码网址:https://gitee.com/LockzhinerAI/LockzhinerVisionModule/tree/master/Cpp_example/D01_test_detection
目标检测是计算机视觉领域中的一个关键任务,它不仅需要识别图像中存在哪些对象,还需要定位这些对象的位置。具体来说,目标检测算法会输出每个检测到的对象的边界框(Bounding Box)以及其所属类别的概率或置信度得分。
PaddleDetection 是基于百度飞桨深度学习框架开发的一个高效的目标检测库,支持多种先进的目标检测模型,如 YOLO 系列、SSD、Faster R-CNN、Mask R-CNN 等。它提供了简单易用的接口,使得开发者能够快速部署高性能的目标检测应用。
#include <lockzhiner_vision_module/vision/deep_learning/detection/paddle_det.h>
lockzhiner_vision_module::vision::PaddleDetection();
bool Initialize(const std::string& model_path);
void SetThreshold(float score_threshold = 0.5, float nms_threshold = 0.3);
std::vector<lockzhiner_vision_module::vision::DetectionResult> Predict(const cv::Mat& image);
#include <lockzhiner_vision_module/vision/utils/visualize.h>
lockzhiner_vision_module::vision::Rect box() const;
float score() const;
#include <lockzhiner_vision_module/vision/utils/visualize.h>
void lockzhiner_vision_module::vision::Visualize(
const cv::Mat& input_mat,
cv::Mat& output_image,
const std::vector<lockzhiner_vision_module::vision::DetectionResult>& results,
const std::vector<std::string>& labels = {},
float font_scale = 0.4
);
lockzhiner_vision_module::vision::PaddleDet model;
if (!model.Initialize(argv[1])) {
std::cout << "Failed to initialize model." << std::endl;
return 1;
}
auto results = model.Predict(input_mat);
cv::Mat output_image;
lockzhiner_vision_module::vision::Visualize(input_mat, output_image, results);
edit.Print(output_image);
#include <lockzhiner_vision_module/vision/deep_learning/detection/paddle_det.h>
#include <lockzhiner_vision_module/vision/utils/visualize.h>
#include <lockzhiner_vision_module/edit/edit.h>
#include <chrono>
#include <iostream>
#include <opencv2/opencv.hpp>
using namespace std::chrono;
int main(int argc, char* argv[]) {
if (argc != 2) {
std::cerr << "Usage: Test-PaddleDet model_path" << std::endl;
return 1;
}
// 初始化模型
lockzhiner_vision_module::vision::PaddleDet model;
if (!model.Initialize(argv[1])) {
std::cout << "Failed to initialize model." << std::endl;
return 1;
}
lockzhiner_vision_module::edit::Edit edit;
if (!edit.StartAndAcceptConnection()) {
std::cerr << "Error: Failed to start and accept connection." << std::endl;
return EXIT_FAILURE;
}
std::cout << "Device connected successfully." << std::endl;
// 打开摄像头
cv::VideoCapture cap;
cap.set(cv::CAP_PROP_FRAME_WIDTH, 640);
cap.set(cv::CAP_PROP_FRAME_HEIGHT, 480);
cap.open(0);
if (!cap.isOpened()) {
std::cerr << "Error: Could not open camera." << std::endl;
return 1;
}
cv::Mat input_mat;
while (true) {
// 捕获一帧图像
cap >> input_mat;
if (input_mat.empty()) {
std::cerr << "Warning: Captured an empty frame." << std::endl;
continue;
}
// 调用模型进行预测
high_resolution_clock::time_point start_time = high_resolution_clock::now();
auto results = model.Predict(input_mat);
high_resolution_clock::time_point end_time = high_resolution_clock::now();
// 计算推理时间
auto time_span = duration_cast<milliseconds>(end_time - start_time);
std::cout << "Inference time: " << time_span.count() << " ms" << std::endl;
// 可视化结果
cv::Mat output_image;
lockzhiner_vision_module::vision::Visualize(input_mat, output_image, results);
edit.Print(output_image);
}
cap.release();
return 0;
}
cmake_minimum_required(VERSION 3.10)
project(D01_test_detection)
set(CMAKE_CXX_STANDARD 17)
set(CMAKE_CXX_STANDARD_REQUIRED ON)
# 定义项目根目录路径
set(PROJECT_ROOT_PATH "${CMAKE_CURRENT_SOURCE_DIR}/../..")
message("PROJECT_ROOT_PATH = " ${PROJECT_ROOT_PATH})
include("${PROJECT_ROOT_PATH}/toolchains/arm-rockchip830-linux-uclibcgnueabihf.toolchain.cmake")
# 定义 OpenCV SDK 路径
set(OpenCV_ROOT_PATH "${PROJECT_ROOT_PATH}/third_party/opencv-mobile-4.10.0-lockzhiner-vision-module")
set(OpenCV_DIR "${OpenCV_ROOT_PATH}/lib/cmake/opencv4")
find_package(OpenCV REQUIRED)
set(OPENCV_LIBRARIES "${OpenCV_LIBS}")
# 定义 LockzhinerVisionModule SDK 路径
set(LockzhinerVisionModule_ROOT_PATH "${PROJECT_ROOT_PATH}/third_party/lockzhiner_vision_module_sdk")
set(LockzhinerVisionModule_DIR "${LockzhinerVisionModule_ROOT_PATH}/lib/cmake/lockzhiner_vision_module")
find_package(LockzhinerVisionModule REQUIRED)
add_executable(Test-detection test_detection.cc)
target_include_directories(Test-detection PRIVATE ${LOCKZHINER_VISION_MODULE_INCLUDE_DIRS})
target_link_libraries(Test-detection PRIVATE ${OPENCV_LIBRARIES} ${LOCKZHINER_VISION_MODULE_LIBRARIES})
install(
TARGETS Test-detection
RUNTIME DESTINATION .
)
使用 Docker Destop 打开 LockzhinerVisionModule 容器并执行以下命令来编译项目
# 进入Demo所在目录
cd /LockzhinerVisionModuleWorkSpace/LockzhinerVisionModule/Cpp_example/D01_test_detection
# 创建编译目录
rm -rf build && mkdir build && cd build
# 配置交叉编译工具链
export TOOLCHAIN_ROOT_PATH="/LockzhinerVisionModuleWorkSpace/arm-rockchip830-linux-uclibcgnueabihf"
# 使用cmake配置项目
cmake ..
# 执行编译项目
make -j8 && make install
在执行完上述命令后,会在build目录下生成可执行文件。
chmod 777 Test-detection
# 在实际应用的过程中LZ-Picodet需要替换为下载的或者你的rknn模型
./Test-detection LZ-Picodet
本文档详细介绍了目标检测的基础知识及 PaddleDetection 的基本概念,并提供了详细的API文档说明,帮助开发者理解和实现目标检测与可视化功能。通过上述流程,可以构建高效的实时目标检测系统,满足多种应用场景的需求。