สารบัญ:
- ขั้นตอนที่ 1: บทนำ
- ขั้นตอนที่ 2: ทรัพยากรที่ใช้
- ขั้นตอนที่ 3:
- ขั้นตอนที่ 4: ข้อกำหนดเบื้องต้น
- ขั้นตอนที่ 5: ความต้องการของคอมพิวเตอร์
- ขั้นตอนที่ 6: ตั้งค่า YOLO
- ขั้นตอนที่ 7: แก้ไข MakeFile
- ขั้นตอนที่ 8: รอให้เสร็จสมบูรณ์
- ขั้นตอนที่ 9: สำหรับคอมพิวเตอร์ที่ไม่ตรงตามข้อกำหนด
- ขั้นตอนที่ 10: YOLO V3
- ขั้นตอนที่ 11: เรียกใช้ YOLO
- ขั้นตอนที่ 12: YOLO V3 - รูปภาพ
- ขั้นตอนที่ 13: YOLO V3 - ป้อนรูปภาพ
- ขั้นตอนที่ 14: YOLO V3 - เอาต์พุตอิมเมจ
- ขั้นตอนที่ 15: YOLO V3 - หลายภาพ
- ขั้นตอนที่ 16: YOLO V3 - WebCam
- ขั้นตอนที่ 17: YOLO V3 - วิดีโอ
- ขั้นตอนที่ 18: YOLO V3 - วิดีโอ EXPO3D 1
- ขั้นตอนที่ 19: YOLO V3 - วิดีโอ EXPO3D 2
- ขั้นตอนที่ 20: YOLO V3 - วิดีโอ EXPO3D 3
- ขั้นตอนที่ 21: PDF เพื่อดาวน์โหลด
2025 ผู้เขียน: John Day | [email protected]. แก้ไขล่าสุด: 2025-01-13 06:58
เรื่องนี้เป็นเรื่องที่ฉันทึ่งมาก จนทำให้ฉันนอนไม่หลับ: คอมพิวเตอร์วิทัศน์ การตรวจจับวัตถุและผู้คนผ่านแบบจำลองที่ได้รับการฝึกมาล่วงหน้า
ขั้นตอนที่ 1: บทนำ
เราจะใช้อัลกอริทึม YoloV3 เพื่อเรียกใช้แอปพลิเคชันและเรียกใช้โครงการ
ฉันทำงานกับโครงข่ายประสาทเทียมเมื่อ 15 ปีที่แล้ว และฉันสามารถพูดได้ว่านี่เป็นช่วงเวลาที่ "ยาก" เนื่องจากทรัพยากรที่มีอยู่ในขณะนั้น
ขั้นตอนที่ 2: ทรัพยากรที่ใช้
· กล้องโลจิเทค C270
· คอมพิวเตอร์
· NVIDIA GeForce GTX 1660
ขั้นตอนที่ 3:
ขั้นตอนที่ 4: ข้อกำหนดเบื้องต้น
ในการรัน Deep Neural Network (DNN) จำเป็นต้องใช้การประมวลผลแบบขนานกับ GPU
ดังนั้น คุณจะต้องใช้การ์ดแสดงผลอันทรงพลังจาก NVIDIA และรันอัลกอริทึมโดยใช้ CUDA API (ชุดคำสั่งเสมือน GPU)
ในการรันอัลกอริธึม คุณต้องติดตั้งแพ็คเกจต่อไปนี้ก่อน:
- ไดรฟ์การ์ดแสดงผล NVIDIA
- CUDA
- CUDNN (ห้องสมุดเครือข่ายประสาทลึก CUDA)
- OpenCV
ขั้นตอนที่ 5: ความต้องการของคอมพิวเตอร์
ขั้นตอนที่ 6: ตั้งค่า YOLO
การตรวจจับโดยใช้แบบจำลองที่ผ่านการฝึกอบรมมาแล้ว
เปิดเทอร์มินัลแล้วป้อนคำสั่งด้านบน
ขั้นตอนที่ 7: แก้ไข MakeFile
แก้ไขไฟล์ “MakeFile” ดังรูปด้านบน เพราะเราจะใช้การประมวลผล GPU, CUDNN และ OpenCV หลังจากแก้ไขแล้ว ให้รันคำสั่ง 'make'
ขั้นตอนที่ 8: รอให้เสร็จสมบูรณ์
คำสั่ง 'make' ในขั้นตอนที่ 7 จะรวบรวมทุกอย่างสำหรับใช้โดยอัลกอริธึม และจะใช้เวลาสักครู่ในการรัน
ขั้นตอนที่ 9: สำหรับคอมพิวเตอร์ที่ไม่ตรงตามข้อกำหนด
หากคอมพิวเตอร์และการ์ดแสดงผลของคุณไม่มีประสิทธิภาพหรือคุณต้องการประสิทธิภาพที่ดีขึ้น ให้เปลี่ยนไฟล์ 'cfg /yolov3.cfg'
การกำหนดค่าข้างต้นถูกใช้ในโครงการนี้
ขั้นตอนที่ 10: YOLO V3
โดยทั่วไป ระบบตรวจจับจะใช้แบบจำลองนี้กับรูปภาพในตำแหน่งและมาตราส่วนที่แตกต่างกันหลายแห่ง
YOLO ใช้โครงข่ายประสาทเดียวกับภาพทั้งหมด เครือข่ายนี้แบ่งภาพออกเป็นส่วนๆ และจัดเตรียมกรอบขอบเขตและความน่าจะเป็นสำหรับแต่ละภูมิภาค
YOLO มีข้อดีหลายประการ มองเห็นภาพโดยรวม ดังนั้นการคาดคะเนจึงถูกสร้างขึ้นโดยบริบททั่วโลกในภาพ
มันทำการคาดคะเนด้วยการประเมินเครือข่ายเดียว ซึ่งแตกต่างจาก R-CNN ที่ทำการประเมินหลายพันครั้งสำหรับภาพเดียว
เร็วกว่า R-CNN ถึง 1,000 เท่า และเร็วกว่า Fast R-CNN ถึง 100 เท่า
ขั้นตอนที่ 11: เรียกใช้ YOLO
หากต้องการเรียกใช้ YOLO เพียงเปิดเทอร์มินัลในโฟลเดอร์ " darknet " และป้อนคำสั่ง
คุณสามารถเรียกใช้ YOLO ได้ 4 วิธี:
· ภาพ
·หลายภาพ
· สตรีมมิ่ง (เว็บแคม)
·วิดีโอ
ขั้นตอนที่ 12: YOLO V3 - รูปภาพ
วางรูปภาพที่คุณต้องการในโฟลเดอร์ "data" ภายใน darknet และหลังจากนั้นให้รันคำสั่งด้านบนเพื่อแก้ไขชื่อรูปภาพ
ขั้นตอนที่ 13: YOLO V3 - ป้อนรูปภาพ
ขั้นตอนที่ 14: YOLO V3 - เอาต์พุตอิมเมจ
ขั้นตอนที่ 15: YOLO V3 - หลายภาพ
วางรูปภาพในโฟลเดอร์บางโฟลเดอร์ แทนที่จะระบุพาธของรูปภาพ ให้เว้นว่างไว้และเรียกใช้คำสั่งดังที่คุณเห็นด้านบน (ทางด้านซ้าย)
หลังจากนั้น สิ่งที่คล้ายกับรูปทางด้านขวาจะปรากฏขึ้น เพียงวางเส้นทางของรูปภาพแล้วคลิก " Enter " และทำซ้ำขั้นตอนเหล่านี้สำหรับรูปภาพหลายภาพ
ขั้นตอนที่ 16: YOLO V3 - WebCam
เรียกใช้คำสั่งด้านบนและหลังจากโหลดเครือข่าย เว็บแคมจะปรากฏขึ้น
ขั้นตอนที่ 17: YOLO V3 - วิดีโอ
วางวิดีโอที่คุณต้องการในโฟลเดอร์ "data" ภายใน darknet และหลังจากนั้นให้รันคำสั่งด้านบนเพื่อแก้ไขชื่อวิดีโอ
ขั้นตอนที่ 18: YOLO V3 - วิดีโอ EXPO3D 1
ขั้นตอนที่ 19: YOLO V3 - วิดีโอ EXPO3D 2
ขั้นตอนที่ 20: YOLO V3 - วิดีโอ EXPO3D 3
ขั้นตอนที่ 21: PDF เพื่อดาวน์โหลด
ดาวน์โหลด PDF (ในภาษาโปรตุเกสแบบบราซิล)