เพิ่มเสียงเริ่มทริกเกอร์ให้กับ Google AIY Voice Kit: 6 ขั้นตอน (พร้อมรูปภาพ)
เพิ่มเสียงเริ่มทริกเกอร์ให้กับ Google AIY Voice Kit: 6 ขั้นตอน (พร้อมรูปภาพ)

วีดีโอ: เพิ่มเสียงเริ่มทริกเกอร์ให้กับ Google AIY Voice Kit: 6 ขั้นตอน (พร้อมรูปภาพ)

วีดีโอ: เพิ่มเสียงเริ่มทริกเกอร์ให้กับ Google AIY Voice Kit: 6 ขั้นตอน (พร้อมรูปภาพ)
วีดีโอ: Hacking the Google AIY Voice Kit Part 2 - Voice Control 2025, มกราคม
Anonim
Image
Image
ขั้นตอนที่ 2: ตรวจสอบไฟล์ Voicehat.py เพื่อดูข้อมูลเพิ่มเติม
ขั้นตอนที่ 2: ตรวจสอบไฟล์ Voicehat.py เพื่อดูข้อมูลเพิ่มเติม

กวดวิชานี้ค่อนข้างง่าย ฉันสนุกกับ Google AIY Voice Kit มาก แต่ชอบเสียงที่ Google Home ปกติของฉันทำเพื่อยืนยันว่าพวกเขากำลังฟังอยู่ ค่านี้ไม่ได้ตั้งค่าตามค่าเริ่มต้นในตัวอย่างใดๆ ที่โหลดไว้ล่วงหน้าบนอิมเมจ AIY Voice Kit

ฉันยังรวมลิงก์ไปยังเสียงเริ่มต้นของหุ้นและยืนยันเสียงที่ฉันบันทึกจากหน้าแรกของ Google จริงด้วยเครื่องบันทึกการซูมของฉันด้วย

ที่นี่เราไป - คำสั่งแรกของฉัน!

ขั้นตอนที่ 1: วัสดุและไฟล์ที่จำเป็น

  1. Google AIY Voice Kit ที่ทำงานได้อย่างสมบูรณ์ - เพื่อตั้งค่าชุดของคุณไปที่หน้า AIY Voice Kit อย่างเป็นทางการ
  2. ความสามารถในการเข้าถึงเทอร์มินัล Pi ของคุณผ่าน SSH, VNC หรือด้วยจอภาพและแป้นพิมพ์
  3. ไฟล์. Wav ที่คุณต้องการเล่นเมื่อ Pi กำลังฟังการป้อนข้อมูลด้วยเสียง - หากไม่ได้ใช้ไฟล์ที่กำหนดเอง ให้ดาวน์โหลดไฟล์มาตรฐาน "St art Talking" ที่นี่ หรือดาวน์โหลดจากลิงก์ที่แนบมา
  4. (ไม่บังคับ) โปรแกรมแก้ไขเสียงที่สามารถแปลงไฟล์และเปลี่ยนบิตและอัตราตัวอย่าง

ขั้นตอนที่ 2: ขั้นตอนที่ 2: ตรวจสอบไฟล์ Voicehat.py เพื่อดูข้อมูลเพิ่มเติม

สำคัญ

ฉันไม่ได้ใช้รูปภาพล่าสุดในชุดเสียงของฉันที่มีรหัสสำหรับทั้งชุดเสียงและการมองเห็น (เช่น aiyprojects-2018-01-03.img) ฉันใช้รหัสจากสาขา Voice Kit ที่สามารถพบได้ใน Google AIY Raspbian GitHub ความคิดเห็นส่วนตัวของฉันคือใช้สาขา Voice Kit เพื่อให้ง่าย และไม่ต้องจัดการกับรหัส Vision เมื่อคุณทำงานกับชุดเสียงของคุณ

กำลังเดินทางไป…

ขั้นตอนนี้ไม่ได้บังคับโดยสิ้นเชิง แต่จะแสดงให้คุณเห็นว่า Google ได้ฝังคำแนะนำในการทำงานไว้ที่ไหน หากคุณต้องการก้าวไปอีกขั้นหรือเข้าใจว่าทำไมโค้ดที่ฉันเพิ่มจึงใช้งานได้

pi@raspberry: cd AIY-voice-kit-python/src/aiy/

จากนั้นเราจะตรวจสอบไฟล์ voicehat.py ในโฟลเดอร์นั้น:

pi@raspberry: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py

รูปภาพที่แนบมาแสดงตำแหน่งที่คุณสามารถเรียนรู้เกี่ยวกับ UI สถานะและวิธีใช้เสียงระหว่างทริกเกอร์

เอาล่ะ เรามาเพิ่มโค้ดบางส่วนในไฟล์ตัวอย่างเพื่อให้สิ่งนี้ทำงาน

ขั้นตอนที่ 3: ขั้นตอนที่ 3: เพิ่มรหัสเสียงทริกเกอร์ไปยังรหัสสาธิต

ขั้นตอนที่ 3: เพิ่มรหัสเสียงทริกเกอร์ไปยังรหัสสาธิต
ขั้นตอนที่ 3: เพิ่มรหัสเสียงทริกเกอร์ไปยังรหัสสาธิต

ขั้นแรก ไปที่โฟลเดอร์ AIY-voice-kit-python และเรียกใช้ซอร์สโค้ด

cd AIY-voice-kit-python

แหล่งที่มา env/bin/activate

cd src

จากนั้นใช้ 'sudo nano' เป็น 'assistant_grpc_demo.py' หรือ 'assistant_library_demo.py'

ความแตกต่างระหว่างสองไฟล์คือ assistant_grpc_demo.py ใช้ปุ่มเพื่อเรียกใช้ Google Assistant และ assistant_library_demo.py ใช้คำเปิดใช้งาน "Ok, Google" เพื่อเรียกใช้ Google Assistant

สำหรับไฟล์ทั้งสองนี้ คุณจะต้องเพิ่มโค้ดเพียงบรรทัดเดียว:

status_ui.set_trigger_sound_wave('/home/pi/googlestart.wav')

ถือว่าคุณได้วางเสียงเริ่มต้นในโฟลเดอร์ /home/pi/ และตั้งชื่อว่า googlestart.wav เปลี่ยนสิ่งเหล่านี้ตามสิ่งที่คุณตั้งชื่อไฟล์ของคุณและทุกที่ที่คุณอยู่

บรรทัดของรหัสที่เรากำลังมองหาอยู่ด้านล่าง:

status_ui.status('กำลังฟัง')

เราต้องการเพิ่มโค้ดบรรทัดใหม่ก่อนโค้ดบรรทัดนั้น…

สำหรับตัวอย่าง 'assistant_library_demo.py' สามารถพบได้ที่นี่:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# และตอนนี้เพิ่มรหัสของเรา status_ui.set_trigger_sound_wave('home/pi/googlestart.wav') status_ui.status('listening')

สำหรับตัวอย่าง 'assistant_grpc_demo.py' สามารถพบได้ที่นี่:

ปุ่ม. wait_for_press()

# และตอนนี้เพิ่มรหัสของเรา status_ui.set_trigger_sound_wave('/home/pi/googlestart.wav') status_ui.status('listening')

ถือว่าคุณได้วางเสียงเริ่มต้นในโฟลเดอร์ /home/pi/ และตั้งชื่อว่า googlestart.wav เปลี่ยนสิ่งเหล่านี้ตามสิ่งที่คุณตั้งชื่อไฟล์ของคุณและทุกที่ที่คุณอยู่

กด CTRL-X & Y เพื่อบันทึกทุกอย่าง

***หมายเหตุ: ฉันได้พบบางสิ่งที่โง่เขลาเล็กน้อย สำหรับ 'assistant_library_demo.py' การเพิ่มเสียงทริกเกอร์ดูเหมือนจะไม่สร้างความแตกต่างในการทำงานของการรู้จำคำพูด สำหรับ 'assistant_grpc_demo.py' ดูเหมือนว่าเมื่อคุณใช้เสียงทริกเกอร์ มันจะตัดคำแรกหรือสองคำที่คุณพูด ไม่แน่ใจว่าทำไม ยังคงพยายามที่จะคิดออก

ขั้นตอนที่ 4: ขั้นตอนที่ 4: เรียกใช้โค้ดและทำให้แน่ใจว่าทุกอย่างพร้อมแล้ว

pi@raspberry: cd AIY-voice-kit-python

และโหลด virtualenv

pi@raspberry:~/AIY-voice-kit-python $ source env/bin/activate

และเรียกใช้!

(env) pi@raspberry:~/AIY-voice-kit-python $ src/assistant_library_demo.py

หรือ

(env) pi@raspberry:~/AIY-voice-kit-python $ src/assistant_grpc_demo.py

ตอนนี้พูดว่า "ตกลง Google" หรือกดปุ่มนั้นแล้วดูว่าใช้งานได้หรือไม่!

หน้าถัดไปจะช่วยคุณถ้าคุณมีไฟล์ที่กำหนดเองและบิตและอัตราตัวอย่างที่เหมาะสมสำหรับไฟล์.wav ของคุณ

ขั้นตอนที่ 5: ขั้นตอนที่ 5: สร้างไฟล์.wav ของคุณเอง

ขั้นตอนที่ 5: สร้างไฟล์.wav ของคุณเอง
ขั้นตอนที่ 5: สร้างไฟล์.wav ของคุณเอง

หากคุณไม่สนใจที่จะใช้ไฟล์.wav ที่เป็นเสียงเริ่มต้นของ Google Home แบบมาตรฐาน คุณจะต้องสร้างไฟล์.wav ของคุณเอง ต้องใช้การทดลองและข้อผิดพลาดเล็กน้อยเพื่อให้ได้บิตและอัตราตัวอย่างที่ถูกต้องจึงจะได้ผลสำหรับฉัน

ฉันใช้ Logic Pro X ในการตัดต่อทั้งหมด (ในภาพ) ซึ่งเป็น DAW ที่ครบถ้วนสมบูรณ์สำหรับการสร้างและผลิตเพลง ฉันพบว่าสองตัวเลือกที่เหมาะสมคือ Switch หรือ MediaHuman Audio Converter ฉันคิดว่าคุณสามารถทำเช่นนี้กับ Garageband หากคุณมี Mac แต่ฉันยังไม่ได้ลองใช้

ไฟล์ของคุณมีสามส่วนหลักที่จำเป็นสำหรับการทำงานกับโค้ดสาธิต

  1. ต้องเป็นไฟล์เสียง MONO
  2. อัตราตัวอย่างต้องเป็น 32000
  3. ต้องเป็นไฟล์.wav
  4. (ไม่บังคับ) ความละเอียด 16 บิตทำงานได้ดีที่สุดสำหรับฉัน

ขั้นตอนที่ 6: ขั้นตอนที่ 6: เพิ่มเสียงยืนยันหรือไม่

นี่คือที่ฉันติดอยู่ถ้าใครมีความคิดใด ๆ ฉันชอบที่จะเพิ่มเสียงยืนยันหากระบบรู้จักการป้อนข้อมูลด้วยเสียงเหมือนในหน้าแรกของ Google ปกติ

ฉันได้แนบเสียงยืนยันสต็อกด้านล่างเพื่อความสะดวกของคุณ

สนุก!