
สารบัญ:
2025 ผู้เขียน: John Day | [email protected]. แก้ไขล่าสุด: 2025-01-23 15:12

ในบทความนี้ เราจะอธิบายความหมายของ Digital Image Processing (DIP) และเหตุผลในการใช้ฮาร์ดแวร์ เช่น Pixy และเครื่องมืออื่นๆ เพื่อสร้างกระบวนการเกี่ยวกับรูปภาพหรือวิดีโอ ในตอนท้ายของบทความนี้ คุณจะได้เรียนรู้:
- รูปแบบของภาพดิจิทัลเป็นอย่างไร
- การประมวลผลภาพดิจิทัลคืออะไร
- เครื่องมือสำหรับการประมวลผลภาพ
- Pixy คืออะไรและใช้งานอย่างไร
ขั้นตอนที่ 1: การประมวลผลภาพคืออะไร?

รูปภาพ วิดีโอ และรูปภาพโดยทั่วไป นอกเหนือจากการบันทึกช่วงเวลาแห่งความทรงจำของเราแล้ว ยังมีแอปพลิเคชันอื่นๆ ด้วย บางทีคุณอาจเห็นกล้องรักษาความปลอดภัยในที่สาธารณะ หรือคุณเห็นหุ่นยนต์ติดตามบรรทัด วัตถุ หรือขั้นสูงกว่าที่ทราบสถานการณ์ แยกสิ่งสกปรกออกจากผลิตภัณฑ์ในสายการผลิต และการใช้งานที่คล้ายกันหรือคล้ายกันจำนวนมากกำลังดำเนินการกับการคำนวณบางอย่างเกี่ยวกับรูปภาพและสิ่งเหล่านี้ การคำนวณเรียกว่าการประมวลผลภาพ
เพื่อความเข้าใจที่ดีที่สุด การรู้โครงสร้างภาพจะเป็นประโยชน์ ทุกภาพเป็นสัญญาณที่มีค่าพิกเซล ณ จุดใดจุดหนึ่ง (พิกเซลเป็นหน่วยพื้นฐานของภาพดิจิทัลที่สามารถมีค่าความสว่างและ/หรือสีต่างกันได้ ค่าเหล่านี้เรียกว่า “ความเข้ม”) สัญญาณคือสัญญาณแรงดันไฟต่อเนื่องที่กำหนดโดยเซ็นเซอร์ภาพ สัญญาณนี้จะถูกแปลงเป็นดิจิตอล สร้างด้วยกระบวนการบางอย่างเช่นการสุ่มตัวอย่าง รูปแบบดิจิทัลของข้อมูลเหล่านี้เหมือนกับอาร์เรย์สองมิติหรือเมทริกซ์ที่สร้างภาพดิจิทัล ดังนั้นรูปแบบคือ f (X, Y) สำหรับตำแหน่งและค่า อย่าลืมว่าทุกวิดีโอเป็นชุดของภาพที่เล่นโดยมีอัตราการเล่นเฉพาะในหนึ่งวินาที
หลังจากสร้างภาพแล้ว กระบวนการจะเริ่มขึ้น เพื่อจุดประสงค์ใดที่เราต้องการกระบวนการ หากเราต้องการข้อมูลจากภาพ เราจะใช้คอมพิวเตอร์วิทัศน์ คอมพิวเตอร์วิทัศน์เป็นวิธีการจำลองการมองเห็นของมนุษย์ การมองเห็นของมนุษย์มีความสามารถใน "เรียนรู้" และให้ข้อมูลจากการป้อนข้อมูลด้วยภาพ คอมพิวเตอร์วิทัศน์โดยพื้นฐานแล้วเป็นสาขาที่ทำให้คอมพิวเตอร์ได้รับความเข้าใจในระดับสูงจากภาพหรือวิดีโอดิจิทัลแม้ในการใช้งานแบบเรียลไทม์ และการประมวลผลภาพดิจิทัลก็เป็นส่วนหนึ่ง
ขั้นตอนที่ 2: วิธีการประมวลผลภาพ?


หากเรากำลังคิดเกี่ยวกับแอปพลิเคชันหุ่นยนต์สำหรับการประมวลผลภาพ มีสองวิธี:
- เลือกโมดูลกล้องปกติ (ให้ภาพโดยไม่มีการประมวลผล) จากนั้นใช้โปรแกรมและการคำนวณโดยผู้ใช้
- ใช้ฮาร์ดแวร์ที่ทำกระบวนการนี้เพื่อให้ใช้งานได้เร็วและง่ายขึ้น เหมือนกล้อง pixy…
วิธีแก้ปัญหาแรก: สำหรับวิธีแรก มีซอฟต์แวร์ที่แตกต่างกัน เช่น MATLAB หรือไลบรารี เช่น OpenCV สำหรับการเข้ารหัส มีชื่ออื่นในเครื่องมือประมวลผลด้วย แต่ชื่อที่นิยมค้นหาสำหรับการประมวลผลนี้คือ OpenCV และ MATLAB มาดูการเปรียบเทียบอย่างรวดเร็วระหว่างกัน แผนภูมิเปรียบเทียบ MATLAB และ OpenCV จะช่วยเราได้
วิธีที่สอง: ใช้ฮาร์ดแวร์พิเศษ! เช่นกล้องที่มีความสามารถในการประมวลผลภาพ พวกเขามักจะมีส่วนต่อประสานกับผู้ใช้และไม่ต้องการการเข้ารหัส ดูเหมือนง่ายกว่า แต่อย่างใดทำให้เกิดข้อ จำกัด และพวกเขาสามารถทำสิ่งที่ระบุไว้สำหรับสิ่งนั้น ตัวอย่างเช่น กล้องตรวจจับใบหน้าไม่สามารถจดจำสีได้ตามปกติ (อาจมีการเปลี่ยนแปลงในเฟิร์มแวร์บางอย่างสามารถเปลี่ยนอัลกอริธึมการจดจำใบหน้าได้ แต่นั่นเป็นวิธีที่ยากและไม่ธรรมดา!) สองวิธี แต่วิธีไหนดีกว่ากัน?
แผนภูมิที่สองคือการเปรียบเทียบสองวิธี
ขั้นตอนที่ 3: เริ่มต้นโดย Pixy

PIXY เป็นหนึ่งในโมดูลกล้องที่กำหนดไว้สำหรับการประมวลผลภาพ อัลกอริธึมการรู้จำคือการกรองตามสี จุดประสงค์หลักของกล้องนี้คือการรับรู้สีและตั้งชื่อให้เป็นวัตถุที่คุ้นเคย กล้องนี้สามารถ "เรียนรู้" ว่าคุณ "คิด" สีอะไรได้บ้างในตอนแรก
ตอนนี้คุณรู้แล้วว่า Pixy คืออะไร มาดูกันว่าเราจะเริ่มใช้ Pixy ได้อย่างไร
ขั้นตอนที่ 4: ฮาร์ดแวร์ที่จำเป็น

Pixy CMUcam5 อิมเมจเซนเซอร์
Arduino UNO R3
ขั้นตอนที่ 5: เริ่มต้นโดย Pixy

ตอนนี้มากับเราทีละขั้นตอนจนจบ:
ขั้นแรก:
ซื้อ pixy! PIXY ปกติและ PIXY2 เป็นกล้อง pixy สองเวอร์ชัน คลิกลิงก์ด้านบนเพื่อซื้อแบบปกติ ซึ่งเราดำเนินการตามขั้นตอนของการใช้บอร์ดนี้ต่อไป
ที่สอง:
เพิ่มพลัง บอร์ดมีพอร์ต USB สำหรับจ่ายไฟ มันจะใช้พลังงานจากการเชื่อมต่อกับพอร์ต USB ของคอมพิวเตอร์ มันสามารถขับเคลื่อนผ่านสองพินหลังบอร์ดพร้อมแบตเตอรี่ (6-10v)
ที่สาม:
เชื่อมต่อกับคอมพิวเตอร์ผ่านสาย USB ปลายด้านหนึ่งไปยังคอมพิวเตอร์และอีกด้านไปยังพอร์ต micro USB ของ PIXY
มา:
ดาวน์โหลดซอฟต์แวร์กล้องของคุณที่นี่ PIXY Mon เป็นแอปพลิเคชั่นของ PIXY สำหรับแพลตฟอร์ม Linux, Mac และ Windows สิ่งที่แอปนี้ทำได้คือการกำหนดค่าและแสดงสิ่งที่ PIXY มองเห็นได้
ที่ห้า:
ถึงจุดนี้ กล้องไม่จำเป็นต้องเชื่อมต่อกับไมโครคอนโทรลเลอร์หรือบอร์ด ถ้าคุณต้องการดูและจดจำโดยไม่มีสิ่งอื่นใด การรับรู้ไม่ได้ขึ้นอยู่กับการเชื่อมต่อไมโคร อย่างไรก็ตาม สำหรับการสอน ให้เลือกวัตถุที่มีเฉดสีชัดเจนและสวยงาม เนื่องจากอัลกอริธึมการรับรู้การกรองสีตามเฉดสี สีสันและแสงของสภาพแวดล้อมอาจส่งผลต่อผลลัพธ์ ดังนั้น อย่าเลือกวัตถุสีขาว สีดำ หรือสีเทา เพราะสีเหล่านี้ไม่ใช่เฉดสี!
ที่หก:
กดปุ่มด้านบนของ PIXY เพื่อเริ่มการสอน ขั้นแรก LED จะกะพริบและหลังจากนั้น RGB LED จะได้รับสีของส่วนกลางของพื้นที่สายตา เลือกวัตถุที่อยู่ด้านหน้ากล้อง หาก LED แสดงสีที่ถูกต้อง แสดงว่ากำลังล็อกด้านขวา ระยะห่างระหว่างเลนส์กับวัตถุควรอยู่ที่ 6-20 นิ้ว วิธีที่สองคือการใช้ PIXY MON; เลือกพื้นที่ขนาดใหญ่ของวัตถุใน PIXY MON จากนั้นเลือกวัตถุ
ที่เจ็ด:
ตารางของวัตถุจะแสดงเป็น pixy mon ดูว่าเส้นตารางเป็นพื้นที่ด้านขวาของวัตถุที่ไม่รวมพื้นหลังหรือไม่ แถบเลื่อนในการกำหนดค่าสามารถช่วยให้มีพื้นที่ที่ดีขึ้น
ที่แปด:
ตอนนี้สำหรับแต่ละ "สี" กล้องจะตั้งค่าตัวเลข 7 ลายเซ็น หมายถึง 7 สีที่ต้องจดจำ ด้วยการใช้สีที่ใกล้เคียงกัน ตัวอย่างเช่น ป้ายกำกับที่มีสีแดง-ชมพู-น้ำเงิน คุณสามารถกำหนดวัตถุหรือสถานที่สำหรับกล้องได้ ตัวอย่างเช่น ป้ายกำกับนั้นแสดงที่ประตู ซึ่งจะช่วยให้จดจำวัตถุได้หลายพันชิ้นด้วยกล้องนี้! ชุดสีนี้เรียกว่า “รหัสสี” หรือ CC สำหรับการตั้งค่า CC คุณควรใช้ PIXY mon และจากนั้นก็สามารถใช้งานได้เหมือนลายเซ็นใดๆ
เก้า:
หลังจากสอนสำเร็จแล้ว หากไมโครคอนโทรลเลอร์หรือบอร์ดเชื่อมต่อกับกล้อง สามารถให้วัตถุที่ตรวจพบโดย pixy ได้ หากคุณกำลังใช้ Arduino ให้ใช้พินเอาต์นี้สำหรับการเชื่อมต่อ (คลิกที่นี่เพื่อดูข้อมูลเพิ่มเติม) จากนั้นดาวน์โหลดไลบรารี PIXY ที่นี่ เพิ่มไปยังไลบรารีของ Arduino ในทิศทางของ Sketch>Include library>Add ZIP library ตอนนี้เลือกไฟล์ zip ของไลบรารี เสร็จแล้ว! ด้วยภาพสเก็ตช์เริ่มต้นของ PIXY มันจะให้ X และ Y (ตำแหน่ง) และความกว้างและความยาว (ขนาด) ของวัตถุ สามารถใช้สเก็ตช์อื่นๆ ได้เช่นกัน เหมือนแพนและเอียง สำหรับการเชื่อมต่อบอร์ดอื่นๆ คุณสามารถดูได้ที่นี่
หมายเหตุ: การสอนมีสองวิธีตามที่เราอธิบาย: 1. การใช้ PIXY โดยไม่มี PIXY MON เช่นเดียวกับที่หุ่นยนต์ทำและไม่ได้เชื่อมต่อกับพีซี วิธีการจะเป็น แต่จะกำหนดหมายเลขลายเซ็นอย่างไร? นำถ้า PIXY จะเปลี่ยนสีในช่วงเวลาแรกของการสอน การคลิกที่คุณทำซึ่งสีจะกำหนดตัวเลข จากสีแดงหมายถึง 1 ถึงสีม่วงหมายถึง 7. ในวิธีที่ 2 การตั้งค่าตัวเลขจะทำได้โดยใช้โปรแกรมเท่านั้น
ขั้นตอนที่ 6: ใกล้กับ “จุดจบ” มาก
เราได้อธิบายเกี่ยวกับสิ่งที่ทำให้จำเป็นต้องใช้รูปภาพ การประมวลผลภาพดิจิทัลคืออะไร และทำอย่างไร วิธีที่เรามีและจากฮาร์ดแวร์ที่ช่วยเราได้ในตอนนี้ เราเลือก PIXY สำหรับการอธิบาย เราอธิบายวิธีการทำงานและจะทำอย่างไรถ้าคุณเป็นมือใหม่ของกล้อง pixy! ตอนนี้คุณสามารถเริ่มการประมวลผลภาพสำหรับหุ่นยนต์ตัวเล็กของคุณและสนุกกับการมีตาที่สามกับคอมพิวเตอร์ของคุณ
คุณสามารถอ่านโครงการนี้ได้ที่เว็บไซต์ทางการของ ElectroPeak:https://electropeak.com/learn/guides/introduction/
แนะนำ:
การออกแบบเกมในการสะบัดใน 5 ขั้นตอน: 5 ขั้นตอน

การออกแบบเกมในการสะบัดใน 5 ขั้นตอน: การตวัดเป็นวิธีง่ายๆ ในการสร้างเกม โดยเฉพาะอย่างยิ่งเกมปริศนา นิยายภาพ หรือเกมผจญภัย
การตรวจจับใบหน้าบน Raspberry Pi 4B ใน 3 ขั้นตอน: 3 ขั้นตอน

การตรวจจับใบหน้าบน Raspberry Pi 4B ใน 3 ขั้นตอน: ในคำแนะนำนี้ เราจะทำการตรวจจับใบหน้าบน Raspberry Pi 4 ด้วย Shunya O/S โดยใช้ Shunyaface Library Shunyaface เป็นห้องสมุดจดจำใบหน้า/ตรวจจับใบหน้า โปรเจ็กต์นี้มีจุดมุ่งหมายเพื่อให้เกิดความเร็วในการตรวจจับและจดจำได้เร็วที่สุดด้วย
วิธีการติดตั้งปลั๊กอินใน WordPress ใน 3 ขั้นตอน: 3 ขั้นตอน

วิธีการติดตั้งปลั๊กอินใน WordPress ใน 3 ขั้นตอน: ในบทช่วยสอนนี้ ฉันจะแสดงขั้นตอนสำคัญในการติดตั้งปลั๊กอิน WordPress ให้กับเว็บไซต์ของคุณ โดยทั่วไป คุณสามารถติดตั้งปลั๊กอินได้สองวิธี วิธีแรกคือผ่าน ftp หรือผ่าน cpanel แต่ฉันจะไม่แสดงมันเพราะมันสอดคล้องกับ
การลอยแบบอะคูสติกด้วย Arduino Uno ทีละขั้นตอน (8 ขั้นตอน): 8 ขั้นตอน

การลอยแบบอะคูสติกด้วย Arduino Uno ทีละขั้นตอน (8 ขั้นตอน): ตัวแปลงสัญญาณเสียงล้ำเสียง L298N Dc ตัวเมียอะแดปเตอร์จ่ายไฟพร้อมขา DC ตัวผู้ Arduino UNOBreadboardวิธีการทำงาน: ก่อนอื่น คุณอัปโหลดรหัสไปยัง Arduino Uno (เป็นไมโครคอนโทรลเลอร์ที่ติดตั้งดิจิตอล และพอร์ตแอนะล็อกเพื่อแปลงรหัส (C++)
เครื่อง Rube Goldberg 11 ขั้นตอน: 8 ขั้นตอน

เครื่อง 11 Step Rube Goldberg: โครงการนี้เป็นเครื่อง 11 Step Rube Goldberg ซึ่งออกแบบมาเพื่อสร้างงานง่ายๆ ในรูปแบบที่ซับซ้อน งานของโครงการนี้คือการจับสบู่ก้อนหนึ่ง