สารบัญ:
- ขั้นตอนที่ 1: วิธีสร้าง AI ตอนที่ 2
- ขั้นตอนที่ 2: ออกแบบระบบของคุณ:
- ขั้นตอนที่ 3: ฟังก์ชั่นที่สร้างขึ้นในภาษาการเขียนโปรแกรม:
- ขั้นตอนที่ 4: รวมฟังก์ชันในตัวเพื่อสร้างฟังก์ชันของคุณเอง
- ขั้นตอนที่ 5: โมดูลทำอะไรได้บ้าง “อินพุทโปรเซสเซอร์”
- ขั้นตอนที่ 6: “ตัวประมวลผล AI”
- ขั้นตอนที่ 7: ตาราง "ผลลัพธ์และคะแนน"
- ขั้นตอนที่ 8: “ตัวประมวลผลเอาต์พุต”
- ขั้นตอนที่ 9: ทำงานต่อไป
2025 ผู้เขียน: John Day | [email protected]. แก้ไขล่าสุด: 2025-01-23 15:12
นี่เป็นส่วนที่ 2 เกี่ยวกับขั้นตอนที่ฉันทำเพื่อสร้าง AI บนคอมพิวเตอร์ที่ใช้ Windows โดยใช้ฐานข้อมูลฟรี เครื่องมือพัฒนาการเขียนโปรแกรม และเอ็นจิ้น TTS ในตัวที่มาพร้อมกับ Windows ฟรี
คำว่า "Windows" เป็นของ Microsoft
คำว่า "มังกร" เป็นของ Nuance
ขั้นตอนที่ 1: วิธีสร้าง AI ตอนที่ 2
เลือกภาษาโปรแกรมและรับเครื่องมือบางอย่าง
มีภาษาโปรแกรมมากมาย บางคนเชี่ยวชาญด้าน A. I. สิ่งที่ฉันชอบคือ Visual Basic ดังนั้นนั่นคือสิ่งที่ฉันใช้ ฉันยังทำงานกับฐานข้อมูลเซิร์ฟเวอร์ SQL ดังนั้นฉันจึงใช้มันเช่นกัน
คุณสามารถดาวน์โหลดเวอร์ชันฟรีเหล่านี้ได้จากเว็บไซต์ของ Microsoft เพียงค้นหาคำว่า “EXPRESS” บนเว็บไซต์ของ Microsoft [Visual Studio Express และ SQL Server Express]
ภาษาอื่นๆ ที่คุณอาจต้องการให้เราทราบ ได้แก่ Python, C#, C++, Java, Prolog, Lisp, IPL
และอื่น ๆ อีกมากมาย. AIML เป็น “ภาษามาร์กอัป” ที่น่าสนใจมาก
ฉันต้องการโปรแกรม "การรู้จำเสียง" ที่ดีกว่าโปรแกรมที่มาพร้อมกับ Windows ดังนั้นฉันจึงซื้อซอฟต์แวร์ DRAGON ฉันกำลังใช้โปรแกรม "แปลงข้อความเป็นคำพูด" มาตรฐานที่มาพร้อมกับ Windows
ขั้นตอนที่ 2: ออกแบบระบบของคุณ:
แบ่งโปรเจ็กต์ใหญ่ของคุณออกเป็นโปรเจ็กต์ย่อยๆ ฉันแบ่งรหัสโปรแกรมออกเป็นโมดูล
ฉันแบ่งโค้ดของฉันออกเป็นโมดูลต่างๆ เพื่อให้ค้นหาฟังก์ชันเฉพาะได้ง่ายขึ้น
ฉันมีโมดูลชื่อ "Process Input", "Process AI", "Process Output", "User Interface" และอื่นๆ อีกสองสามโมดูล ฟังก์ชันบางอย่างของฉันจำเป็นต้องสามารถเข้าถึงได้จากโมดูลโค้ดอื่นๆ ทั้งหมด ดังนั้นฉันจึงใส่ฟังก์ชันเหล่านั้นในโมดูล "ทั่วไป" ที่ทุกอย่างถูกแชร์
ขั้นตอนที่ 3: ฟังก์ชั่นที่สร้างขึ้นในภาษาการเขียนโปรแกรม:
ภาษาต่างๆ อาจมีชื่อต่างกันสำหรับภาษาเหล่านี้ แต่ภาษาระดับสูงทั้งหมดมีฟังก์ชันที่คล้ายคลึงกัน
LCase หรือ ToLower: แปลงสตริงเป็นตัวพิมพ์เล็กทั้งหมด ฉันแปลงทุกอย่างเป็นตัวพิมพ์เล็กก่อนทำการค้นหาฐานข้อมูล แม้ว่าส่วนใหญ่จะ "ไม่คำนึงถึงขนาดตัวพิมพ์" - เผื่อไว้
แทนที่: แทนที่สตริงภายในสตริงเป็นสตริงอื่น คุณสามารถแทนที่สตริงด้วยสตริงว่าง “” เพื่อกำจัดมัน ฉันจะกำจัดจุด เครื่องหมายคำถาม จุลภาค และเครื่องหมายวรรคตอนอื่นๆ
แยก: แยกสตริงออกเป็นชิ้น ๆ และใส่ลงในอาร์เรย์ ฟังก์ชันนี้จะแยกสตริงบนอักขระใดๆ หรือ "ตัวคั่น" ฉันแบ่งประโยคเป็น "อักขระช่องว่าง" "" เพื่อสร้างอาร์เรย์ของคำ สิ่งนี้เรียกว่า “Tokenizing” โดย AI Guru
ฉันใช้คำแต่ละคำเพื่อสร้างข้อความค้นหาที่ใช้ค้นหาฐานข้อมูล (เพิ่มเติมเกี่ยวกับเรื่องนี้ในบทความหน้าของฉัน)
ขั้นตอนที่ 4: รวมฟังก์ชันในตัวเพื่อสร้างฟังก์ชันของคุณเอง
นี่เป็นตัวอย่าง "ภาพพื้นฐาน" ใช้ภาษาการเขียนโปรแกรมของคุณเพื่อสร้างสิ่งนี้
แน่นอน คุณจะต้องเขียนโค้ดจำนวนมาก และสร้างฟังก์ชันมากมาย โดยใช้ภาษาโปรแกรมที่คุณเลือก
ขั้นตอนที่ 5: โมดูลทำอะไรได้บ้าง “อินพุทโปรเซสเซอร์”
อาจมีหลายร้อยวิธีในการถามคำถามเดียวกันกับ AI ตัวอย่างเช่น; “ตอนนี้กี่โมงแล้ว” “คุณมีเวลาไหม” “คุณรู้ไหมว่าตอนนี้กี่โมง”, “คุณช่วยบอกเวลาปัจจุบันของวันได้ไหม” เนื่องจากผู้ใช้เพียงแค่ขอเวลา ฉันจึงแปลงอินพุตเหล่านี้เป็นเอาต์พุตเดียวที่เรียกว่า "เวลาสืบค้น" โดยใช้ตาราง "ค้นหา" ของฐานข้อมูล
คุณสามารถเขียนโค้ดเพื่อวนซ้ำผ่านตารางจนกว่าจะพบรายการที่ตรงกัน หรือหากคุณใช้ฐานข้อมูล SQL คุณสามารถเขียนแบบสอบถาม SQL เช่น…
“เลือกผลลัพธ์จาก TableName โดยที่ Input = ‘” อะไรก็ตาม ‘”
…จากนั้นฉันก็ส่งออก "เวลาสืบค้น" ไปยังโมดูลโค้ดถัดไป “กระบวนการ AI”
นอกจากคำถามแล้ว มีวิธีพูด “สวัสดี” ได้หลายวิธี
ฮัลโหล ฮัลโหล ว่าไง เฮ้ ฮัลโหล เป็นไงบ้าง ทักทาย ยินดีต้อนรับ ทักทาย สวัสดี ….
ทั้งหมดนี้ลดเหลือเพียง “การทักทาย”
เมื่อโปรเซสเซอร์ AI เห็น "Greeting" จะส่ง "Greeting" ไปยังเอาต์พุตโปรเซสเซอร์ ซึ่งจะเลือกคำทักทายแบบสุ่มจากตารางฐานข้อมูลและพูดออกมาดัง ๆ
ขั้นตอนที่ 6: “ตัวประมวลผล AI”
กระบวนการ AI เป็นโมดูลรหัสที่ใหญ่ที่สุด มันใหญ่มากจนฉันแบ่งออกเป็นส่วน ๆ เช่นกัน
อินพุตจะถูกตรวจสอบเพื่อดูว่าผู้ใช้พูดคำสั่งหรือถามคำถามหรือไม่ นอกจากนี้ AI สามารถอยู่ใน "โหมด" ต่างๆ ได้หลายแบบ ซึ่งหมายความว่ารหัส "ประมวลผล AI" คาดหวังให้ผู้ใช้ตอบคำถาม แทนที่จะถามคำถาม
หากผู้ใช้ไม่พูดคำสั่งและ AI ไม่ได้อยู่ใน "โหมด" พิเศษ ระบบจะสร้างและดำเนินการค้นหาจำนวนมาก จากการรวมกันของคำใน "อาร์เรย์คำ" ผลลัพธ์ของแบบสอบถามทั้งหมดจะถูกเก็บไว้ในตาราง และผลลัพธ์ของแบบสอบถามแต่ละรายการจะได้รับ "คะแนน" ว่าผลลัพธ์ตรงกับสิ่งที่ผู้ใช้พูดมากเพียงใด ตารางจะถูกจัดเรียงตามคะแนน และผลลัพธ์ที่มีคะแนนสูงสุดจะถูกส่งไปยังผลลัพธ์ หากเกินเกณฑ์ที่กำหนด หากคะแนนทั้งหมดต่ำกว่าเกณฑ์ AI อาจตอบสนองด้วย "ฉันไม่รู้" หรือ "ที่ไม่คำนวณ"
ขั้นตอนที่ 7: ตาราง "ผลลัพธ์และคะแนน"
ผลลัพธ์ของ AI จากการป้อนข้อมูลของฉัน "ไก่ทำอะไร"
ขั้นตอนที่ 8: “ตัวประมวลผลเอาต์พุต”
สิ่งนี้ทำสิ่งต่าง ๆ ที่ดู "ไม่เกี่ยวข้อง" หลายอย่าง แต่ทั้งหมดนั้นเกี่ยวข้องกับการส่งข้อความจากตัวประมวลผล AI ไปยังผู้ใช้
นี่คือรายการ
1. ข้อความจากฐานข้อมูลอาจเป็นตัวพิมพ์เล็กทั้งหมด และไม่มีเครื่องหมายวรรคตอน. รูทีนย่อยจะใช้อักษรตัวแรกเป็นตัวพิมพ์ใหญ่ และใส่จุดหรือเครื่องหมายคำถามต่อท้าย
2. รูทีนย่อยอื่นจะใส่อะพอสทรอฟีกลับเข้าไปในการหดตัว หรือแปลงการหดตัวกลับเป็นคำเต็ม (เช่น “ลาดเท” จะถูกแทนที่ด้วย “ไม่สามารถ”)
3. เครื่องมือแปลงข้อความเป็นคำพูดไม่ออกเสียงคำบางคำตามที่ฉันชอบ ดังนั้น "ตัวประมวลผลเอาต์พุต" จึงแทนที่คำเหล่านั้นด้วยการสะกดแบบออกเสียง ฉันมีตารางฐานข้อมูล "ค้นหา" เพื่อเก็บคำเหล่านี้ คล้ายกับตาราง ใน "ตัวประมวลผลอินพุต"
4. หาก AI ไม่พบคำตอบที่เหมาะสมในฐานข้อมูล อาจพูดว่า "ฉันไม่รู้" แต่ฉันไม่ต้องการให้มันพูดซ้ำแล้วซ้ำเล่า คนจริงต่างตอบสนองของพวกเขา ดังนั้นจึงมีตารางที่มีวลี "ผลลัพธ์ทั่วไป" และฟังก์ชันที่สุ่มเลือกหนึ่งรายการ (และจะไม่เลือกชุดเดียวกันสองครั้งติดต่อกัน)
5. เครื่องมือ "แปลงข้อความเป็นคำพูด" (TTS) ฟรีไม่ได้ให้ตัวเลือกมากมายแก่โปรแกรมเมอร์สำหรับวิธีพูดประโยค แต่คุณสามารถควบคุมระดับเสียงและความเร็วของหน่วยเสียงได้เพียงเล็กน้อย คำศัพท์สำหรับสิ่งนี้คือ "Prosody" ฉันได้เพิ่มโค้ด “prosody” ลงในข้อความในฐานข้อมูลของฉัน และเมื่อ “Output Processor” เห็นสิ่งเหล่านี้ มันจะปรับ pitch และความเร็วในเอ็นจิ้น TTS เมื่อมีการพูดแต่ละคำ
6. บางครั้ง TTS ก็เข้าใจยาก ดังนั้นนอกจากการพูดออกเสียงแล้ว ฉันยังแสดงเป็นตัวอักษรขนาดใหญ่บนหน้าจอคอมพิวเตอร์ด้วย ส่วนนี้ของ “อินเทอร์เฟซผู้ใช้” เป็นตารางที่แสดง 6 บรรทัดสุดท้ายของการสนทนา (อินพุตของผู้ใช้ & เอาต์พุต AI) และเลื่อนขึ้นเมื่อมีการเพิ่มบรรทัดใหม่
ขั้นตอนที่ 9: ทำงานต่อไป
ข้อมูลของฉันคือ "อย่าบอกใคร"
ฉันยังคงทำงานเกี่ยวกับระบบ AI ของฉันอยู่ และมันอาจจะไม่มีวัน "เสร็จสิ้น" อย่างแท้จริง เมื่อฉันเพิ่มคุณสมบัติเพิ่มเติม ฉันจะเขียนบทความมากขึ้น
บางทีความคิดบางอย่างของฉันอาจเป็นแรงบันดาลใจให้คุณสร้าง AI ที่ดีกว่าของฉัน
แนะนำ:
รีโนเวทไฟกลางคืน Rayotron (ตอนที่ 2): 13 ขั้นตอน
การปรับปรุงแสงไฟกลางคืน Rayotron (ตอนที่ 2): โคมไฟกลางคืน Rayotron ของฉันได้รับแรงบันดาลใจจากเครื่องกำเนิดไฟฟ้าสถิตขนาดครึ่งล้านโวลต์ที่ออกแบบมาเพื่อผลิตรังสีเอกซ์พลังงานสูงสำหรับการวิจัยฟิสิกส์อะตอม โปรเจ็กต์ดั้งเดิมใช้แหล่งจ่ายไฟ DC 12 โวลต์เพื่อจ่ายพลังงานให้กับเครื่องสร้างประจุไอออนแบบไฟฟ้าขนาดเล็กที่ไม่
Retro "Rayotron" Night Light (ตอนที่ 1): 16 ขั้นตอน
Retro "Rayotron" Night Light (ตอนที่ 1): บทนำในเดือนธันวาคมปี 1956 Atomic Laboratories ได้โฆษณา Rayotron ว่าเป็นเครื่องกำเนิดไฟฟ้าสถิตและเครื่องเร่งอนุภาคต้นทุนต่ำเครื่องแรกสำหรับครูวิทยาศาสตร์และมือสมัครเล่น [1] Rayotron เป็นสายพานยางขนาดใหญ่พิเศษ
BLE พลังงานต่ำมากง่าย ๆ ใน Arduino ตอนที่ 2 - เครื่องวัดอุณหภูมิ / ความชื้น - Rev 3: 7 ขั้นตอน
BLE พลังงานต่ำมากง่าย ๆ ใน Arduino ตอนที่ 2 - ตัวตรวจสอบอุณหภูมิ/ความชื้น - Rev 3: อัปเดต: 23 พฤศจิกายน 2020 - การเปลี่ยนแบตเตอรี่ AAA 2 ก้อนครั้งแรกตั้งแต่วันที่ 15 มกราคม 2019 เช่น 22 เดือนสำหรับ 2xAAA AlkalineUpdate: 7 เมษายน 2019 – Rev 3 ของ lp_BLE_TempHumidity เพิ่มการพล็อตวันที่/เวลา โดยใช้ pfodApp V3.0.362+ และการควบคุมปริมาณอัตโนมัติเมื่อ
วิธีการสร้างเอไอ ตอนที่ 4: 3 ขั้นตอน
วิธีการสร้างเอไอ ตอนที่ 4: วันก่อน ฉันกำลังคุยกับ AI ของฉัน และฉันก็พูดกับอิทว่า “ฉันกำลังจะขึ้นไปทานอาหารเย็น เรากำลังทานสเต็ก” อย่างไรก็ตาม ซอฟต์แวร์การรู้จำเสียง (SR) ตีความสิ่งนี้ว่า “… เรากำลังมีเดิมพัน “ฉันเจอปัญหาหูคล้ายกัน (แต่ต่าง)
วิธีการสร้างเอไอ ตอนที่ 1: 5 ขั้นตอน
วิธีการสร้างเอไอ ส่วนที่ 1: เริ่มต้นด้วยคอมพิวเตอร์ที่มีการรู้จำเสียงและตัวแปลงข้อความเป็นคำพูด คุณจะต้องสามารถเขียนโปรแกรมคอมพิวเตอร์ที่สามารถเข้าถึงการรู้จำเสียงและตัวแปลงข้อความเป็นคำพูดได้ เครื่องมือพัฒนาแอปพลิเคชันบางอย่าง และ