2025 ผู้เขียน: John Day | [email protected]. แก้ไขล่าสุด: 2025-01-13 06:58
Mona เป็นหุ่นยนต์ AI ที่ใช้ watson Ai เป็นพื้นหลัง เมื่อฉันเริ่มโครงการนี้ มันดูซับซ้อนกว่าที่ฉันคิดไว้มาก แต่เมื่อฉันเริ่มทำงาน คลาสความรู้ความเข้าใจของ ibm (ลงทะเบียนที่นี่) ช่วยฉันได้มาก ถ้าคุณต้องการ คุณสามารถทำได้ เข้าชั้นเรียนตอนนี้หรืออย่างอื่นเพียงแค่ดำเนินการต่อกับคำแนะนำนี้
ฉันต้องการบอทของฉันเพื่อตอบสนองต่อสิ่งต่อไปนี้
1. เมื่อฉันพูด
2.เมื่อต้องการพูด
3.เมื่อต้องการควบคุมการเคลื่อนไหวของตา/กราม…ฯลฯ
ดังนั้น เมื่อฉันพูด ควรแปลงคำพูดของฉันเป็นข้อความ จากนั้นควรตรวจสอบในฐานข้อมูล (เอนทิตี / เหตุการณ์ /) จากนั้นจะต้องพูดคำตอบเช่นข้อความเป็นคำพูด
ดังนั้นคุณต้องการสิ่งด้านล่าง
ก่อนใช้บริการด้านล่าง กรุณาสร้างบัญชี IBM Bluemix
1.ข้อความเป็นคำพูด
2.พูดเป็นข้อความ
3.ผู้ช่วยวัตสัน
ขั้นตอนที่ 1: เตรียมสิ่งของของคุณ
1.ราสเบอร์รี่ปี่.
2.ไมค์
3.ลำโพง
กะโหลกศีรษะ (พิมพ์ 3d):
ไฟล์ 3D Printing สามารถพบได้ที่นี่:คลิกที่นี่
และเหนือสิ่งอื่นใด คุณควรมีการเชื่อมต่ออินเทอร์เน็ตที่เหมาะสม…………
ตอนนี้ฉันกำลังจะใช้ราสเบอร์รี่ pi เพื่อประมวลผลทั้งหมด
หากคุณเคยใช้ Raspberry Pi มาก่อน ให้ติดตั้ง Node.js และไปที่ขั้นตอนถัดไป
มิฉะนั้น ให้ทำตามคำแนะนำด้านล่างเพื่อตั้งค่า Pi ของคุณ:
การเริ่มต้นใช้งาน Pi Raspberry Pi นั้นคล้ายกับคอมพิวเตอร์ทั้งเครื่อง ซึ่งหมายความว่าคุณต้องมีจอภาพ เมาส์ และคีย์บอร์ดสำหรับมัน หากคุณมีทีวีอยู่ใกล้ๆ คุณสามารถเชื่อมต่อ Pi กับทีวีผ่านสาย HDMI ในชุดอุปกรณ์ Pi ส่วนใหญ่ การ์ด SD ได้รับการโหลดไว้ล่วงหน้าด้วยภาพของระบบปฏิบัติการ Raspberry Pi คุณต้องใส่การ์ด SD ลงใน Pi เปิด Pi และทำตามคำแนะนำบนหน้าจอเพื่อทำการติดตั้งระบบปฏิบัติการให้เสร็จสิ้น หากคุณมีปัญหาในการตั้งค่า Pi คุณสามารถแก้ไขปัญหาได้ที่นี่
ติดตั้งแพ็คเกจ เปิดแอปพลิเคชั่นเทอร์มินัลบน Pi และรันคำสั่งต่อไปนี้เพื่อติดตั้ง Node.js และ npm เวอร์ชันล่าสุด (Node Package Manager)
คุณต้องใช้แพ็คเกจเหล่านี้ในภายหลังเพื่อเรียกใช้โค้ดของคุณ
curl -sL https://ibm.biz/tjbot-bootstrap | sudo sh
เสียบไมโครโฟน USB และลำโพงของคุณ
ขึ้นอยู่กับแหล่งสัญญาณเสียงออกที่คุณใช้กับ Pi (HDMI, แจ็คเสียง 3.5 มม., Bluetooth, ลำโพง USB) คุณอาจต้องตั้งค่าคอนฟิกเสียง
แจ็คเสียง HDMI/ 3.5 มม. หากคุณใช้แจ็คเสียง HDMI หรือ 3.5 มม. คุณอาจต้องตั้งค่าการกำหนดค่าเสียง ในการดำเนินการนี้ ให้ไปที่เทอร์มินัลแล้วเปิด raspi-config
sudo raspi-config
ซึ่งจะเปิดหน้าจอการกำหนดค่า Raspberry Pi
เลือก "ตัวเลือกขั้นสูง" แล้วกด Enter จากนั้นเลือก "เสียง" แล้วกด Enter เลือกช่องสัญญาณที่ถูกต้องสำหรับเสียงที่ส่งออก หากคุณเชื่อมต่อลำโพงภายนอกเข้ากับแจ็คเสียง คุณควรเลือกแจ็ค 3.5 มม.
ลำโพง USB:
หากคุณมีเสียง USB คุณต้องอัปเดต /usr/share/alsa/alsa.config เพื่อตั้งค่าเสียง USB เป็นอุปกรณ์เริ่มต้น เริ่มต้นด้วยการเรียกใช้คำสั่งต่อไปนี้เพื่อให้แน่ใจว่า USB ของคุณเชื่อมต่อและแสดงรายการอยู่ที่นั่น
lsusb
ถัดไปคือการตรวจสอบหมายเลขการ์ดของ USB audio.aplay -l
จดหมายเลขการ์ดที่เชื่อมโยงกับ USB Audio ของคุณ
จากนั้นไปที่ไฟล์ alsa.config เพื่อตั้งค่าเป็นค่าเริ่มต้น
sudo nano /usr/share/alsa/alsa.conf
มองหา
defaults.ctl.card 0
defaults.pcm.card 0
และอัปเดตหมายเลขการ์ด (0 ที่นี่) เป็นหมายเลขการ์ดของเสียง USB ของคุณ
Raspberry Pi OS เวอร์ชันต่างๆ อาจต้องมีการตั้งค่าที่แตกต่างกัน หากคุณมีปัญหากับการตั้งค่า USB ให้อ่านคู่มือนี้เพื่อแก้ไขปัญหา
ขั้นตอนที่ 2: รหัส Git-hub
ซอร์สโค้ดมีอยู่ที่ github ดาวน์โหลดหรือโคลนโค้ดและรันคำสั่งต่อไปนี้จากเทอร์มินัลเพื่อติดตั้งการขึ้นต่อกัน ต่อไปนี้คือคำแนะนำสำหรับวิธีโคลนที่เก็บจาก github หากคุณยังไม่เคยทำมาก่อน
โคลน git
cd mona/สูตร/บทสนทนา
npm ติดตั้ง
เคล็ดลับสำหรับมือโปร: หากคุณได้รับข้อผิดพลาดสำหรับการติดตั้ง npm ที่แจ้งว่าไม่พบ npm คุณควรติดตั้ง npm บนเครื่องของคุณก่อน นี่คือบรรทัดคำสั่งสำหรับติดตั้ง npm
sudo apt-get ติดตั้ง npm
ในขั้นตอนนี้ เราช่วยให้คุณเข้าถึง API ของบริการสนทนาสามบริการ:
(1) คำพูดเป็นข้อความ
(2) ผู้ช่วยวัตสัน
(3) ข้อความเป็นคำพูด
คุณต้องคัดลอกข้อมูลประจำตัวของคุณสำหรับบริการเหล่านี้ทั้งหมด สร้างอินสแตนซ์ของบริการ Watson Assistant, Speech to Text และ Text to Speech และจดข้อมูลรับรองการตรวจสอบสิทธิ์
นำเข้าเวิร์กสเปซ-sample.json
ไฟล์ลงในบริการ Watson Assistant และจดบันทึก ID พื้นที่ทำงาน
ทำสำเนาไฟล์การกำหนดค่าเริ่มต้นและอัปเดตด้วยข้อมูลรับรองบริการ Watson และ ID พื้นที่ทำงานการสนทนา
$ sudo cp config.default.js config.js
$ sudo nano config.js
ขั้นตอนที่ 3: เรียกใช้รหัส
ตอนนี้คุณพร้อมที่จะคุยกับ TJBot แล้ว!
เปิดเทอร์มินัลแล้วรันคำสั่งต่อไปนี้:
sudo node conversation.js
การสนทนาของวัตสันใช้เจตนาเพื่อระบุจุดประสงค์ของประโยค
ตัวอย่างเช่น เมื่อคุณถามโมนาว่า "ได้โปรดแนะนำตัวเอง" เจตนาคือการแนะนำตัว
คุณสามารถเพิ่ม Intents ใหม่ของคุณเองได้ในเครื่องมือแก้ไขการสนทนา แต่สำหรับตอนนี้ เราได้เริ่มต้นให้คุณด้วยความตั้งใจสองสามอย่าง: บทนำ
คุณสามารถพูดวลีเช่น "วัตสัน กรุณาแนะนำตัวเอง", "วัตสัน คุณเป็นใคร" และ "วัตสัน แนะนำตัวเองหน่อยได้ไหม"เรื่องตลก
คุณสามารถถาม "วัตสัน ช่วยเล่าเรื่องตลกให้ฉันฟังหน่อย" หรือ "วัตสัน ฉันอยากฟังเรื่องตลก"
สำหรับรายการทั้งหมด ให้ตรวจสอบเนื้อหาของ workspace-sample.json
ใช้คำให้ความสนใจเพื่อให้ Mona รู้ว่าคุณกำลังคุยกับเขา
คำแสดงความสนใจเริ่มต้นคือ 'Watson' แต่คุณสามารถเปลี่ยนได้ใน config.js ดังนี้
อัปเดตไฟล์การกำหนดค่าเพื่อเปลี่ยนชื่อหุ่นยนต์ในส่วน tjConfig: // ตั้งค่าการกำหนดค่าของ TJBot
exports.tjConfig = {
บันทึก: { ระดับ: 'verbose' },
หุ่นยนต์: { ชื่อ: 'ตี๋ เจย์ บอท' }
};
คุณสามารถเปลี่ยน 'ชื่อ' เป็นอะไรก็ได้ที่คุณต้องการเรียกว่า "โมนา" นอกจากนี้ หากคุณเปลี่ยนเพศเป็น 'ผู้หญิง' TJBot จะใช้เสียงผู้หญิงพูดกับคุณ! สนุก!
มีโอกาสดีที่หนึ่งในสองสิ่งนี้เกิดขึ้น: (1) เอาต์พุตเสียงถูกนำไปยังช่องสัญญาณที่ไม่ถูกต้อง (คุณสามารถแก้ไขได้จาก raspi-config) (2) โมดูลเสียงของคุณถูกบล็อก
ในกรณีนั้น ให้ไปที่ /etc/modprobe.d/ และลบ blacklist-rgb-led.conf จากนั้นรันคำสั่งต่อไปนี้:
sudo update-initramfs -u
รีบูตและยืนยันว่าโมดูล "snd" กำลังทำงานโดยดำเนินการคำสั่ง "lsmod"
สิ่งนี้ควรแก้ปัญหา lsmod