การจดจำใบหน้าในทางปฏิบัติ: 21 ขั้นตอน
การจดจำใบหน้าในทางปฏิบัติ: 21 ขั้นตอน

สารบัญ:

Anonim
Image
Image

เรื่องนี้เป็นเรื่องที่ฉันทึ่งมาก จนทำให้ฉันนอนไม่หลับ: คอมพิวเตอร์วิทัศน์ การตรวจจับวัตถุและผู้คนผ่านแบบจำลองที่ได้รับการฝึกมาล่วงหน้า

ขั้นตอนที่ 1: บทนำ

บทนำ
บทนำ

เราจะใช้อัลกอริทึม YoloV3 เพื่อเรียกใช้แอปพลิเคชันและเรียกใช้โครงการ

ฉันทำงานกับโครงข่ายประสาทเทียมเมื่อ 15 ปีที่แล้ว และฉันสามารถพูดได้ว่านี่เป็นช่วงเวลาที่ "ยาก" เนื่องจากทรัพยากรที่มีอยู่ในขณะนั้น

ขั้นตอนที่ 2: ทรัพยากรที่ใช้

· กล้องโลจิเทค C270

· คอมพิวเตอร์

· NVIDIA GeForce GTX 1660

ขั้นตอนที่ 3:

ภาพ
ภาพ

ขั้นตอนที่ 4: ข้อกำหนดเบื้องต้น

ข้อกำหนดเบื้องต้น
ข้อกำหนดเบื้องต้น
ข้อกำหนดเบื้องต้น
ข้อกำหนดเบื้องต้น

ในการรัน Deep Neural Network (DNN) จำเป็นต้องใช้การประมวลผลแบบขนานกับ GPU

ดังนั้น คุณจะต้องใช้การ์ดแสดงผลอันทรงพลังจาก NVIDIA และรันอัลกอริทึมโดยใช้ CUDA API (ชุดคำสั่งเสมือน GPU)

ในการรันอัลกอริธึม คุณต้องติดตั้งแพ็คเกจต่อไปนี้ก่อน:

- ไดรฟ์การ์ดแสดงผล NVIDIA

- CUDA

- CUDNN (ห้องสมุดเครือข่ายประสาทลึก CUDA)

- OpenCV

ขั้นตอนที่ 5: ความต้องการของคอมพิวเตอร์

ความต้องการของคอมพิวเตอร์
ความต้องการของคอมพิวเตอร์

ขั้นตอนที่ 6: ตั้งค่า YOLO

ตั้งค่า YOLO
ตั้งค่า YOLO

การตรวจจับโดยใช้แบบจำลองที่ผ่านการฝึกอบรมมาแล้ว

เปิดเทอร์มินัลแล้วป้อนคำสั่งด้านบน

ขั้นตอนที่ 7: แก้ไข MakeFile

แก้ไข MakeFile
แก้ไข MakeFile

แก้ไขไฟล์ “MakeFile” ดังรูปด้านบน เพราะเราจะใช้การประมวลผล GPU, CUDNN และ OpenCV หลังจากแก้ไขแล้ว ให้รันคำสั่ง 'make'

ขั้นตอนที่ 8: รอให้เสร็จสมบูรณ์

รอจนเสร็จ
รอจนเสร็จ

คำสั่ง 'make' ในขั้นตอนที่ 7 จะรวบรวมทุกอย่างสำหรับใช้โดยอัลกอริธึม และจะใช้เวลาสักครู่ในการรัน

ขั้นตอนที่ 9: สำหรับคอมพิวเตอร์ที่ไม่ตรงตามข้อกำหนด

สำหรับคอมพิวเตอร์ที่ไม่ตรงตามข้อกำหนด
สำหรับคอมพิวเตอร์ที่ไม่ตรงตามข้อกำหนด

หากคอมพิวเตอร์และการ์ดแสดงผลของคุณไม่มีประสิทธิภาพหรือคุณต้องการประสิทธิภาพที่ดีขึ้น ให้เปลี่ยนไฟล์ 'cfg /yolov3.cfg'

การกำหนดค่าข้างต้นถูกใช้ในโครงการนี้

ขั้นตอนที่ 10: YOLO V3

YOLO V3
YOLO V3

โดยทั่วไป ระบบตรวจจับจะใช้แบบจำลองนี้กับรูปภาพในตำแหน่งและมาตราส่วนที่แตกต่างกันหลายแห่ง

YOLO ใช้โครงข่ายประสาทเดียวกับภาพทั้งหมด เครือข่ายนี้แบ่งภาพออกเป็นส่วนๆ และจัดเตรียมกรอบขอบเขตและความน่าจะเป็นสำหรับแต่ละภูมิภาค

YOLO มีข้อดีหลายประการ มองเห็นภาพโดยรวม ดังนั้นการคาดคะเนจึงถูกสร้างขึ้นโดยบริบททั่วโลกในภาพ

มันทำการคาดคะเนด้วยการประเมินเครือข่ายเดียว ซึ่งแตกต่างจาก R-CNN ที่ทำการประเมินหลายพันครั้งสำหรับภาพเดียว

เร็วกว่า R-CNN ถึง 1,000 เท่า และเร็วกว่า Fast R-CNN ถึง 100 เท่า

ขั้นตอนที่ 11: เรียกใช้ YOLO

วิ่ง YOLO
วิ่ง YOLO
วิ่ง YOLO
วิ่ง YOLO

หากต้องการเรียกใช้ YOLO เพียงเปิดเทอร์มินัลในโฟลเดอร์ " darknet " และป้อนคำสั่ง

คุณสามารถเรียกใช้ YOLO ได้ 4 วิธี:

· ภาพ

·หลายภาพ

· สตรีมมิ่ง (เว็บแคม)

·วิดีโอ

ขั้นตอนที่ 12: YOLO V3 - รูปภาพ

YOLO V3 - รูปภาพ
YOLO V3 - รูปภาพ

วางรูปภาพที่คุณต้องการในโฟลเดอร์ "data" ภายใน darknet และหลังจากนั้นให้รันคำสั่งด้านบนเพื่อแก้ไขชื่อรูปภาพ

ขั้นตอนที่ 13: YOLO V3 - ป้อนรูปภาพ

YOLO V3 - ภาพอินพุต
YOLO V3 - ภาพอินพุต

ขั้นตอนที่ 14: YOLO V3 - เอาต์พุตอิมเมจ

YOLO V3 - ภาพเอาต์พุต
YOLO V3 - ภาพเอาต์พุต

ขั้นตอนที่ 15: YOLO V3 - หลายภาพ

YOLO V3 - หลายภาพ
YOLO V3 - หลายภาพ

วางรูปภาพในโฟลเดอร์บางโฟลเดอร์ แทนที่จะระบุพาธของรูปภาพ ให้เว้นว่างไว้และเรียกใช้คำสั่งดังที่คุณเห็นด้านบน (ทางด้านซ้าย)

หลังจากนั้น สิ่งที่คล้ายกับรูปทางด้านขวาจะปรากฏขึ้น เพียงวางเส้นทางของรูปภาพแล้วคลิก " Enter " และทำซ้ำขั้นตอนเหล่านี้สำหรับรูปภาพหลายภาพ

ขั้นตอนที่ 16: YOLO V3 - WebCam

YOLO V3 - WebCam
YOLO V3 - WebCam

เรียกใช้คำสั่งด้านบนและหลังจากโหลดเครือข่าย เว็บแคมจะปรากฏขึ้น

ขั้นตอนที่ 17: YOLO V3 - วิดีโอ

YOLO V3 - วิดีโอ
YOLO V3 - วิดีโอ

วางวิดีโอที่คุณต้องการในโฟลเดอร์ "data" ภายใน darknet และหลังจากนั้นให้รันคำสั่งด้านบนเพื่อแก้ไขชื่อวิดีโอ

ขั้นตอนที่ 18: YOLO V3 - วิดีโอ EXPO3D 1

YOLO V3 - วิดีโอ EXPO3D 1
YOLO V3 - วิดีโอ EXPO3D 1

ขั้นตอนที่ 19: YOLO V3 - วิดีโอ EXPO3D 2

YOLO V3 - วิดีโอ EXPO3D 2
YOLO V3 - วิดีโอ EXPO3D 2

ขั้นตอนที่ 20: YOLO V3 - วิดีโอ EXPO3D 3

YOLO V3 - วิดีโอ EXPO3D 3
YOLO V3 - วิดีโอ EXPO3D 3

ขั้นตอนที่ 21: PDF เพื่อดาวน์โหลด

ดาวน์โหลด PDF (ในภาษาโปรตุเกสแบบบราซิล)