สารบัญ:
- ขั้นตอนที่ 1: ตั้งค่า Google Cloud Storage Bucket
- ขั้นตอนที่ 2: จัดรูปแบบข้อมูลของคุณและสร้างชุดข้อมูล Csv
- ขั้นตอนที่ 3: อัปโหลดสเปกโตรแกรมของคุณไปยังถังของคุณ
- ขั้นตอนที่ 4: อัปโหลดชุดข้อมูลของคุณ Csv
- ขั้นตอนที่ 5: สร้างชุดข้อมูล
- ขั้นตอนที่ 6: สร้างโมเดล AutoML ของคุณ
- ขั้นตอนที่ 7: ทดสอบแบบจำลองของคุณ
- ขั้นตอนที่ 8: ติดตั้งโมเดลของคุณลงใน ThinkBioT
วีดีโอ: ส่วนที่ 2 รุ่น ThinkBioT พร้อม Google AutoML: 8 ขั้นตอน
2025 ผู้เขียน: John Day | [email protected]. แก้ไขล่าสุด: 2025-01-13 06:58
ThinkBioT ได้รับการออกแบบให้เป็น "พลักแอนด์เพลย์" พร้อมรุ่น TensorFlow Lite ที่เข้ากันได้กับ Edge TPU
ในเอกสารนี้ เราจะกล่าวถึงการสร้างสเปกโตรแกรม การจัดรูปแบบข้อมูลของคุณ และการใช้ Google AutoML
รหัสในบทช่วยสอนนี้จะถูกเขียนด้วย bash ดังนั้นจะเข้ากันได้กับหลายแพลตฟอร์ม
การพึ่งพา
- อย่างไรก็ตาม ก่อนเริ่มต้น คุณจะต้องติดตั้งโปรแกรมเสียงบรรทัดคำสั่งของ Sox ที่เข้ากันได้กับอุปกรณ์ Windows, Mac และ Linux
- หากคุณใช้อุปกรณ์ Windows วิธีที่ง่ายที่สุดในการเรียกใช้สคริปต์ทุบตีคือผ่าน Git ดังนั้นฉันจะแนะนำและดาวน์โหลดและติดตั้งซึ่งมีประโยชน์ในหลาย ๆ ด้าน
- สำหรับการแก้ไขโค้ด ใช้โปรแกรมแก้ไขที่คุณชื่นชอบหรือติดตั้ง NotePad++ สำหรับ windows หรือ Atom สำหรับระบบปฏิบัติการอื่น
**หากคุณมีโมเดล TensorFlow อยู่แล้ว หรือต้องการลองถ่ายโอนการเรียนรู้ด้วยโมเดลที่มีอยู่ โปรดดูเอกสารประกอบของ Google Coral
ขั้นตอนที่ 1: ตั้งค่า Google Cloud Storage Bucket
1. เข้าสู่ระบบในบัญชี gmail ของคุณ (หรือสร้างใหม่หากคุณไม่มีบัญชี Google)
2. ไปที่หน้าตัวเลือกโปรเจ็กต์ และสร้างโปรเจ็กต์ใหม่สำหรับไฟล์โมเดลและสเปกโตรแกรมของคุณ คุณจะต้องเปิดใช้งานการเรียกเก็บเงินเพื่อดำเนินการต่อไป
3. ไปที่ https://cloud.google.com/storage/ และกดปุ่มสร้างที่เก็บข้อมูลที่ด้านบนของหน้า
4. ป้อนชื่อที่เก็บข้อมูลที่คุณต้องการและสร้างที่เก็บข้อมูลโดยยอมรับการตั้งค่าเริ่มต้น
ขั้นตอนที่ 2: จัดรูปแบบข้อมูลของคุณและสร้างชุดข้อมูล Csv
ฉันได้ออกแบบสคริปต์ที่เป็นประโยชน์เพื่อสร้างไฟล์ dataset.csv ที่จำเป็นสำหรับการสร้างแบบจำลองของคุณ ไฟล์ชุดข้อมูลเชื่อมโยงรูปภาพในบัคเก็ตของคุณกับป้ายกำกับในชุดข้อมูล
1. ดาวน์โหลดที่เก็บ ThinkBioT จาก GitHub และ
2. คัดลอกไฟล์ tbt_spect_example.sh จากไดเร็กทอรี Tools ไปยังโฟลเดอร์ใหม่บนเดสก์ท็อปของคุณ
3. เพิ่มไฟล์เสียงที่คุณต้องการใช้ในแบบจำลองของคุณ โดยใส่ไว้ในโฟลเดอร์ที่มีป้ายกำกับ (เช่น คุณต้องการให้จัดเรียงไฟล์อะไร ตัวอย่างเช่น หากคุณต้องการระบุสุนัขหรือแมว คุณสามารถมีโฟลเดอร์ได้ สุนัขพร้อมเสียงเห่าหรือโฟลเดอร์ชื่อแมวพร้อมเสียงแมว ฯลฯ
4. เปิด tbt_spect_example.sh ด้วย Notepad++ และแทนที่ "yourbucknamename" ในบรรทัดที่ 54 ด้วยชื่อ Google Storage Bucket ของคุณ ตัวอย่างเช่น หากที่เก็บข้อมูลของคุณเรียกว่า myModelBucket บรรทัดจะถูกเปลี่ยนเป็น
bucket="gs://myModelBucket/spectro-data/"
5. เรียกใช้โค้ดโดยพิมพ์ข้อความต่อไปนี้ในเทอร์มินัล Bash ของคุณ โค้ดจะรันและสร้างไฟล์ csv ป้ายกำกับและไดเร็กทอรีที่เรียกว่า spectro-data บนเดสก์ท็อปของคุณด้วยสเปกโตรแกรมที่เป็นผลลัพธ์
sh tbt_spect_example.sh
ขั้นตอนที่ 3: อัปโหลดสเปกโตรแกรมของคุณไปยังถังของคุณ
มีสองสามวิธีในการอัปโหลดไปยัง Google Storage วิธีที่ง่ายที่สุดคือการโหลดโฟลเดอร์โดยตรง
1. คลิกชื่อถังของคุณในหน้า Google Storage
2. เลือกปุ่ม "UPLOAD FOLDER" และเลือกไดเร็กทอรี "spectro-data/" ของคุณที่สร้างในขั้นตอนสุดท้าย
หรือ
2. หากคุณมีไฟล์จำนวนมาก คุณสามารถสร้างไดเร็กทอรี "spectro-data/" ด้วยตนเองโดยเลือก "CREATE FOLDER" จากนั้นไปที่โฟลเดอร์และเลือก "UPLOAD FILES" นี่อาจเป็นตัวเลือกที่ยอดเยี่ยมสำหรับชุดข้อมูลขนาดใหญ่ เนื่องจากคุณสามารถอัปโหลดสเปกโตรแกรมในส่วนต่างๆ ได้ แม้กระทั่งการใช้คอมพิวเตอร์หลายเครื่องเพื่อเพิ่มความเร็วในการอัปโหลด
หรือ
2. หากคุณเป็นผู้ใช้ขั้นสูง คุณสามารถอัปโหลดผ่าน Google Cloud Shell ได้
gsutil cp spectro-data/* gs://your-bucket-name/spectro-data/
ตอนนี้คุณควรจะมีสเปกโตรแกรมสวย ๆ เต็มถังแล้ว!
ขั้นตอนที่ 4: อัปโหลดชุดข้อมูลของคุณ Csv
ตอนนี้ เราต้องอัปโหลดไฟล์ model-labels.csv ไปยังไดเร็กทอรี "spectro-data/" ของคุณใน Google Storage โดยพื้นฐานแล้วจะเหมือนกับขั้นตอนสุดท้าย คุณเพียงแค่อัปโหลดไฟล์เดียวแทนที่จะเป็นหลายไฟล์
1. คลิกชื่อถังของคุณในหน้า Google Storage
2. เลือกปุ่ม อัปโหลดไฟล์ และเลือกไฟล์ model-labels.csv ที่คุณสร้างไว้ก่อนหน้านี้
ขั้นตอนที่ 5: สร้างชุดข้อมูล
1. ประการแรก คุณจะต้องค้นหา AutoML VIsion API ซึ่งอาจยุ่งยากเล็กน้อย! วิธีที่ง่ายที่สุดคือค้นหา "automl vision" ในแถบค้นหาของที่เก็บข้อมูล Google Cloud ของคุณ (ในภาพ)
2. เมื่อคุณคลิกที่ลิงค์ API คุณจะต้องเปิดใช้งาน API
3. ตอนนี้ คุณจะอยู่ใน AutoML Vision Dashboard (ในภาพ) ให้คลิกปุ่มชุดข้อมูลใหม่ แล้วเลือก Single label และตัวเลือก 'Select a CSV file' จากนั้นคุณจะรวมลิงก์ไปยังไฟล์ model-labels.csv ของคุณในที่เก็บข้อมูลของคุณ หากคุณได้ปฏิบัติตามบทช่วยสอนนี้ มันจะเป็นตามด้านล่าง
gs://yourBucketName/spectro-data/model-labelsBal.csv
4. จากนั้นกดดำเนินการต่อเพื่อสร้างชุดข้อมูลของคุณ อาจต้องใช้เวลาในการสร้าง
ขั้นตอนที่ 6: สร้างโมเดล AutoML ของคุณ
เมื่อคุณได้รับอีเมลแจ้งให้คุณทราบว่าชุดข้อมูลของคุณถูกสร้างขึ้นแล้ว คุณก็พร้อมที่จะสร้างแบบจำลองใหม่ของคุณ
- กดปุ่ม TRAIN
- เลือกประเภทรุ่น: ค่าประมาณเวลาแฝงของ Edge และรุ่น: Edge TPU และปล่อยให้ตัวเลือกอื่นๆ เป็นค่าเริ่มต้นในตอนแรก ยากที่คุณอาจต้องการทดสอบในภายหลัง
- ตอนนี้โมเดลของคุณจะฝึกแล้ว จะใช้เวลาสักครู่และคุณจะได้รับอีเมลเมื่อพร้อมที่จะดาวน์โหลด
หมายเหตุ: หากคุณใช้งานปุ่มฝึกใช้งานไม่ได้ คุณอาจมีปัญหากับชุดข้อมูลของคุณ หากคุณมีน้อยกว่า 10 ของแต่ละคลาส (ป้ายกำกับ) ระบบจะไม่อนุญาตให้คุณฝึกโมเดล ดังนั้นคุณอาจต้องเพิ่มรูปภาพเพิ่มเติม คุณควรดู Google AutoML Video หากคุณต้องการคำชี้แจง
ขั้นตอนที่ 7: ทดสอบแบบจำลองของคุณ
เมื่อคุณได้รับอีเมลการกรอกแบบจำลองของคุณแล้ว ให้คลิกที่ลิงก์เพื่อกลับไปยัง AutoML Vision API
1. ตอนนี้ คุณจะสามารถดูผลลัพธ์และเมทริกซ์ความสับสนสำหรับแบบจำลองของคุณได้
2. ขั้นตอนต่อไปคือการทดสอบ Model ของคุณ ไปที่ 'TEST & USE' หรือ 'PREDICT' ดูเหมือนว่ามี GUI ผู้ใช้ 2 ตัว ซึ่งฉันเห็นภาพทั้งสองอย่าง แต่ตัวเลือกทั้งสองมีฟังก์ชันการทำงานเหมือนกัน
3. ตอนนี้คุณสามารถอัปโหลดสเปคโตรแกรมทดสอบได้แล้ว ในการสร้างสเปกโตรแกรมเดียว คุณสามารถใช้โปรแกรม tbt_make_one_spect.sh จาก ThinkBioT Github เพียงวางลงในโฟลเดอร์ที่มี wav ที่คุณต้องการแปลงเป็นสเปกโตรแกรม เปิดหน้าต่าง Git Bash (หรือเทอร์มินัล) และใช้โค้ดด้านล่างแทนชื่อไฟล์ของคุณ
sh tbt_make_one_spect.sh yourWavName.wav
4. ตอนนี้เพียงอัปโหลดสเปกโตรแกรมและตรวจสอบผลลัพธ์ของคุณ!
ขั้นตอนที่ 8: ติดตั้งโมเดลของคุณลงใน ThinkBioT
ในการใช้โมเดลใหม่ที่เป็นเงาของคุณ เพียงแค่วางโมเดลและไฟล์ txt ลงในโฟลเดอร์ CModel
pi > ThinkBioT > ClassProcess > CModel
ตอนนี้คุณพร้อมที่จะใช้ ThinkBioT แล้ว:)
**หมายเหตุ** หากคุณกำลังใช้โมเดลของคุณนอกกรอบงาน ThinkBioT คุณจะต้องแก้ไขเอกสารฉลากของคุณโดยเพิ่มตัวเลขที่จุดเริ่มต้นของแต่ละบรรทัด เนื่องจากฟังก์ชัน "readlabels" ในตัวของตัวแปล tflite จะถือว่ามีอยู่ ฉันได้เขียนฟังก์ชันที่กำหนดเองในกรอบงาน ThinkBioT classify_spect.py เป็นวิธีแก้ปัญหาที่คุณสามารถใช้ได้ในโค้ดของคุณเอง:)
def ReadLabelFile(file_path):
ตัวนับ = 0 โดยเปิด (file_path, 'r', encoding='utf-8') เป็น f: lines = f.readlines() ret = {} สำหรับบรรทัดในบรรทัด: ret[int(counter)] = line.strip () เคาน์เตอร์ = เคาน์เตอร์ + 1 คืน ret