Histogram of oriented gradients là gì

      33

HOG là viết tắt của Histogram of Oriented Gradient - một loại “feature descriptor”. Mục tiêu của “featura descriptor” là trừu tượng hóa đối tượng bằng cách trích xuất ra những đặc trưng của đối tượng người sử dụng đó và vứt đi những thông tin không hữu ích. Bởi vậy, HOG được sử dụng hầu hết để tế bào tả hình trạng và sự xuất hiện thêm của một đối tượng người tiêu dùng trong ảnh.Bạn sẽ xem: Histogram of oriented gradients là gì


*

Bản hóa học của cách thức HOG là sử dụng thông tin về việc phân bố của các cường độ gradient (intensity gradient) hoặc của phía biên (edge directins) để mô tả các đối tượng cục bộ trong ảnh. Những toán tử HOG được cài đặt đặt bằng cách chia nhỏ dại một bức hình ảnh thành các vùng con, được điện thoại tư vấn là “tế bào” (cells) với với mỗi cell, ta sẽ đo lường và thống kê một histogram về những hướng của gradients cho những điểm nằm trong cell. Ghép các histogram lại với nhau ta sẽ sở hữu một màn trình diễn cho bức ảnh ban đầu. Để tăng cường hiệu năng nhận dạng, những histogram cục bộ có thể được chuẩn hóa về độ tương phản bằng cách tính một ngưỡng cường độ trong một vùng lớn hơn cell, hotline là các khối (blocks) và thực hiện giá trị ngưỡng đó để chuẩn chỉnh hóa tất cả các cell trong khối. Kết quả sau bước chuẩn hóa sẽ là một trong những vector đặc thù có tính không thay đổi cao hơn đối với các thay đổi về đk ánh sáng.

Bạn đang xem: Histogram of oriented gradients là gì

Có 5 bước cơ phiên bản để tạo một vector HOG đến hình ảnh, bao gồm:

Tiền xử lýTính gradientTính vector đặc trưng cho từng ô (cells)Chuẩn hóa khối (blocks)Tính toán vector HOG

1. Tiền xử lý

Trong bài toán này, để dễ ợt cho bài toán chia những hình hình ảnh thành những khối, ô và giám sát và đo lường đặc trưng ở công việc tiếp theo, chúng ta cần resize size tất cả các hình ảnh trong tập dữ liệu về một kích cỡ chung.

*

Trong những ví dụ được trình bày trong nội dung bài viết này, form size chung cho một hình ảnh sẽ mang định là 64x128

2. Tính Gradient

Đây là bước đầu tiên tiên, được triển khai bằng nhị phép nhân chập ảnh gốc cùng với 2 chiều, khớp ứng với các toán tử đem đạo hàm theo hai hướng Ox và Oy. Vào đó, 2 hướng tương ứng đó là:


*

T là phép toán gửi vị ma trận.

Nghe có vẻ như khó đọc nhỉ, coi hình ảnh dưới đây để có cái chú ý trực quan hơn nhé.


*

*

Khi đó, bạn cũng có thể tính được Gradient bao gồm hai yếu tắc cường độ(Gradient Magnitude) cùng hướng(Gradient Derection) theo bí quyết (*):


Sau bước này, tác dụng thu được sẽ là:


3. Tính vector đặc trưng cho từng ô (cells)

Để đo lường vector đặc thù cho từng ô (cell), chúng ta cần chia hình hình ảnh thành những block, mỗi block lại chia các thành các cell. Để xác định được số block, bọn họ sẽ sử dụng công thức sau:

Sau khi khẳng định số block và kích thước mỗi block, cell, để đo lường vector đặc trưng cho từng cell, chúng ta cần:Chia không khí hướng thành p. Bin(số chiều vector đặc thù của ô).Rời rốc hóa góc hướng nghiêng tại từng điểm hình ảnh vào trong những bin.

Xem thêm: Vì Sao Trong Anh Karaoke ), Phía Sau Một Cô Gái Karaoke

Giả sử góc hướng nghiêng tại pixel tại phần (x,y) gồm độ to là alpha(x,y)

Trường vừa lòng rời rốc hóa unsigned-HOG với p=9:

Giá trị bin được định lượng vì tổng cường độ phát triển thành thiên của các pixels nằm trong về bin đó.Sau khi giám sát đặc trưng ô, ta đã nối những vector đặc thù ô để thu được vector đặc thù khối. Số chiều vector đặc thù khối tính theo bí quyết :

Ví dụ: vào trường hòa hợp này, hình hình ảnh của bọn họ có kích thước là 64x128, ta sẽ phân chia mỗi hình ảnh thành các block có size 16x16. Từng block sẽ bao hàm 4 cell, từng cell có kích thước là 8x8.


Tiếp theo, tiến hành đo lường và thống kê đặc trưng HOG tại từng cell sử dụng không khí hướng 9 bin, trường hợp “unsigned-HOG”. Phía gradient sẽ chạy trong khoảng 0 độ mang lại 180 độ, trung bình trăng tròn độ từng bin.

Tại mỗi cell, sản xuất một biểu đồ độ mạnh gradient bằng cách vote các px vào biểu đồ. Trọng số vote của mỗi pixel dựa vào hướng và cường độ gradient (được đo lường và thống kê từ cách 2) của px đó. Ví dụ:


Như vào hình hình ảnh trên, trước tiên là px có bảo phủ màu xanh lam. Nó được đặt theo hướng 80 độ với cường độ là 2, vì vậy ta thêm 2 vào bin vật dụng 5 (hướng 80 độ). Tiếp theo là pixel có phủ quanh màu đỏ. Nó được đặt theo hướng 10 độ cùng cường độ 4. Vì không có bin 10 độ, buộc phải ta vote mang lại bin 0 độ và trăng tròn độ, từng bin thêm 2 đơn vị.Sau lúc vote hết các pixel trong một cell form size 8x8 vào 9 bin, ta rất có thể thu được tác dụng như sau:


4. Chuẩn hóa khối (blocks)

Để bức tốc hiệu năng nhận dạng, những histogram tổng thể sẽ được chuẩn hóa về độ tương phản bằng phương pháp tính một ngưỡng cường độ trong một khối và áp dụng giá trị kia để chuẩn chỉnh hóa tất cả các ô trong khối. Kết quả sau bước chuẩn chỉnh hóa sẽ là một trong những vector đặc trưng có tính không thay đổi cao hơn so với các biến hóa về điều kiện ánh sáng.

Đầu tiên, hãy coi xét ảnh hưởng của việc chuẩn chỉnh hóa tới những vector gradient trong ví dụ như sau:


Trong hình ảnh trên, trường hợp thứ nhất là một ô của hình ảnh ban đầu. Ngôi trường hợp lắp thêm hai, tất cả các giá chỉ trị px đã được tăng thêm 50. Trong trường hợp lắp thêm ba, toàn bộ các giá trị px được nhân cùng với 1.5.Dễ dàng thấy được, trường thích hợp thứ bố hiển thị độ tương phản gia tăng. Ảnh hưởng trọn của phép nhân là làm các điểm hình ảnh sáng trở yêu cầu sáng rộng nhiều, trong khi những điểm ảnh tối chỉ sáng rộng một chút, cho nên làm tăng mức độ tương phản giữa những phần sáng sủa và buổi tối của hình ảnh.

Hãy quan sát vào những giá trị pixel thực tế và sự biến đổi của vector gradient của bố trường phù hợp trên vào hình hình ảnh sau:


Các nhỏ số trong những ô là giá trị px của các điểm ảnh lân cận điểm ảnh được khắc ghi màu đỏ.Delta F là đạo hàm theo riêng hai vị trí hướng của điểm ảnh ()| Delta F| là quý hiếm cường độ điểm hình ảnh (Gradient Magnitude), tính theo cách làm (*)

Trong trường vừa lòng một với hai, giá trị cường độ vector gradient của chúng tương tự nhau, dẫu vậy trong trường hợp vật dụng ba, cường độ vector gradient đã tăng thêm 1.5 lần. Giả dụ chia bố vector bằng độ lớn tương ứng, ta sẽ nhận được các hiệu quả tương đương cho tất cả ba trưởng hợp. Vì chưng vậy, trong lấy một ví dụ trên, bọn họ thấy rằng bằng cách chia các vector gradient theo độ to của chúng, chúng ta có thể biến bọn chúng thành không thay đổi để thay đổi độ trương phản.

Có nhiều cách thức có thể được dùng để chuẩn chỉnh hóa khối. Gọi v là vector cần chuẩn chỉnh hóa chứa toàn bộ các histogram của mội khối.‖v(k)‖ là giá trị chuẩn chỉnh hóa của v theo các chuẩn k=1, 3 cùng e là một trong những hằng số nhỏ. Lúc đó, những giá trị chuẩn hóa có thể tính bằng một trong những công thức sau:


Ghép các vector đặc trưng khối đang thu được vector đặc thù R-HOG đến ảnh. Số chiều vector đặc trưng hình ảnh tính theo công thức :


Với từng hình hình ảnh kích thước 64x128, chia thành các block 16x16 ck nhau, sẽ có được 7 block ngang cùng 15 block dọc, nên sẽ sở hữu được 7x15 = 105 blocks.Mỗi block bao gồm 4 cell. Khi áp dụng biểu thiết bị 9-bin cho mỗi cell, mỗi block đang được đại diện bởi một vector có size 36x1.Vì vậy, lúc nối toàn bộ các vector trong một block lại cùng với nhau, ta đang thu được vector đặc trưng HOG của hình ảnh có form size 105x36x1 = 3780x1.Link tư liệu tham khảo:

Histogram of Oriented Gradients