industrial-vision-intelligence

Introduction

IVI System is an innovative solution that combines traditional deep learning models, vision-language models, and large language models to address quality control and knowledge management challenges in industrial manufacturing. This project leverages the strengths of YOLOv8, CogVLM, Qwen-72B, and ViT-B-16 to create a comprehensive system for defect detection, analysis, and knowledge extraction.

We demonstrate the system's effectiveness using the publicly available Magnetic Tile Defect Dataset(MTDD) https://github.com/abin24/Magnetic-tile-defect-datasets. as a benchmark case study. The implementation workflow consists of three main components:

Defect Detection Pipeline:

Trained YOLOv8 model on MTDD for defect localization Model outputs include defect classifications and bounding box coordinates Achieves real-time detection capabilities for various defect categories

Knowledge Retrieval System:

Historical defect data and associated knowledge stored in a vector database Implements similarity-based image retrieval using ViT-B-16 embeddings Enables efficient querying of relevant historical cases and expertise

Intelligent Analysis Integration:

Combines current detection results with retrieved historical data Utilizes carefully crafted prompt templates for context structuring Leverages LLM capabilities to generate comprehensive analysis reports This integrated approach enables automated defect analysis while incorporating historical knowledge, resulting in human-readable summaries that facilitate decision-making in industrial quality control processes. The system demonstrates the practical application of combining traditional computer vision techniques with modern AI capabilities for industrial inspection tasks.

Architecture

Key Features

1. Multi-Model Integration

YOLOv8 for real-time object detection and defect identification CogVLM for detailed visual understanding and reasoning Qwen-72B for natural language processing and knowledge extraction ViT-B-16 for image embedding and similarity search

2. Quality Control Pipeline

Automated defect detection and classification Visual anomaly analysis Historical pattern recognition Real-time quality monitoring

3. Knowledge Management

Experience capture and digitalization Visual-textual knowledge base construction Intelligent defect analysis reporting Solution recommendation system

Use Cases

Manufacturing Quality Control

Real-time defect detection
Automated quality assessment
Trend analysis and prediction

Knowledge Management

Expert experience digitalization
Solution retrieval and recommendation
Continuous learning and optimization

Process Optimization

Root cause analysis
Performance monitoring
Improvement suggestion generation

Requirements

Python 3.8+
CUDA 11.8+
PyTorch 2.0+
16+ GB GPU Memory

Training

Yolov8

python3.11 train_yolo.py
python3.11 infer.py --model=./train3/weights/best.pt --image ./path/of/image.jpg --save=./out.jpg

Installation

Yolov8

web server

YOLO_MODEL_PATH=./train_result/weights/best.pt uvicorn web_yolo:app --port 8000

docker

build:
./build.sh
run with default path:
docker run -it --name yoloweb -v /home/xxx/train_result/weights/best.pt:/mnt/models/best.pt -p 8000:8000 yolov8:1.0
run with env and path:
docker run -it --name yoloweb -e YOLO_MODEL_PATH=/app/best.pt -v /home/xxx/train_result/weights/best.pt:/app/best.pt -p 8000:8000 yolov8:1.0

python client

python3.11 client_yolo.py -i dataset/train/images/train_1051.jpg -o out.jpg

http client

curl -X POST "http://localhost:8000/detect" \
     -H "accept: application/json" \
     -H "Content-Type: multipart/form-data" \
     -F "file=@dataset/train/images/train_1051.jpg"

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
dataset		dataset
deployment		deployment
docker		docker
train_result		train_result
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
arch.html		arch.html
client_yolo.py		client_yolo.py
embedding_image.py		embedding_image.py
infer_yolo.py		infer_yolo.py
kserve_yolo.yaml		kserve_yolo.yaml
prepare_dataset.py		prepare_dataset.py
torchserve-config.yaml		torchserve-config.yaml
train_yolo.py		train_yolo.py
web_embedding_vit.py		web_embedding_vit.py
web_yolo.py		web_yolo.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

industrial-vision-intelligence

Introduction

Defect Detection Pipeline:

Knowledge Retrieval System:

Intelligent Analysis Integration:

Architecture

Key Features

1. Multi-Model Integration

2. Quality Control Pipeline

3. Knowledge Management

Use Cases

Manufacturing Quality Control

Knowledge Management

Process Optimization

Requirements

Training

Yolov8

Installation

Yolov8

web server

docker

python client

http client

About

Releases

Packages

Languages

License

apecloud/industrial-vision-intelligence

Folders and files

Latest commit

History

Repository files navigation

industrial-vision-intelligence

Introduction

Defect Detection Pipeline:

Knowledge Retrieval System:

Intelligent Analysis Integration:

Architecture

Key Features

1. Multi-Model Integration

2. Quality Control Pipeline

3. Knowledge Management

Use Cases

Manufacturing Quality Control

Knowledge Management

Process Optimization

Requirements

Training

Yolov8

Installation

Yolov8

web server

docker

python client

http client

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages