
TYPHOON AI ใจอีสาน ที่ทำลายขีดจำกัดด้านภาษาถิ่นของไทย
TYPHOON AI ใจอีสาน ที่ทำลายขีดจำกัดด้านภาษาถิ่นของไทย / ลงทุนแมนจะเล่าให้ฟัง x SCB 10X
ปัจจุบัน AI กำลังพัฒนาไปไกลมากขึ้นเรื่อย ๆ ทั่วโลกต่างแข่งกันสร้างนวัตกรรมใหม่ ๆ เพื่อให้ระบบเข้าใจมนุษย์ได้ดียิ่งขึ้น
อย่างไรก็ตาม ภาษาหลักที่ใช้ในการพัฒนา AI ระดับโลกก็หนีไม่พ้นภาษาอังกฤษ
ส่วนภาษาไทยแม้จะมีการพัฒนาเพิ่มขึ้นมากในช่วงไม่กี่ปีที่ผ่านมา
ส่วนภาษาไทยแม้จะมีการพัฒนาเพิ่มขึ้นมากในช่วงไม่กี่ปีที่ผ่านมา
แต่ส่วนใหญ่ยังอยู่ในระดับการใช้งานและต่อยอด
มากกว่าการพัฒนาเชิงลึกโดยเฉพาะด้านภาษาถิ่น
ซึ่งถือเป็นโจทย์ใหญ่ของประเทศที่มีความหลากหลายทางภาษาอย่างไทย
โดยเฉพาะภาคอีสานที่มีประชากรมากถึง 1 ใน 3 ของประเทศ
มากกว่าการพัฒนาเชิงลึกโดยเฉพาะด้านภาษาถิ่น
ซึ่งถือเป็นโจทย์ใหญ่ของประเทศที่มีความหลากหลายทางภาษาอย่างไทย
โดยเฉพาะภาคอีสานที่มีประชากรมากถึง 1 ใน 3 ของประเทศ
เพื่อแก้ข้อจำกัดนี้ SCB 10X จึงได้พัฒนา “ไต้ฝุ่น” ระบบ AI ด้านภาษา
ที่สามารถเข้าใจและประมวลผล “ภาษาอีสาน” ได้อย่างแม่นยำ
ที่สามารถเข้าใจและประมวลผล “ภาษาอีสาน” ได้อย่างแม่นยำ
ตั้งแต่ระบบรู้จำเสียงพูด (ASR)
การสังเคราะห์เสียงพูด (TTS)
ไปจนถึงคลังข้อมูลภาษาอีสานที่ใช้สอนให้โมเดลเข้าใจวัฒนธรรมและบริบทของคนในพื้นที่ได้ลึกขึ้น
การสังเคราะห์เสียงพูด (TTS)
ไปจนถึงคลังข้อมูลภาษาอีสานที่ใช้สอนให้โมเดลเข้าใจวัฒนธรรมและบริบทของคนในพื้นที่ได้ลึกขึ้น
โดยได้มีการปล่อยชุดข้อมูลภาษาอีสานแบบเปิดที่วิจัยและจัดเก็บอย่างเป็นระบบ (Open Data) ประกอบด้วย
- Isan Speech Transcription Convention แนวทางการถอดเสียงภาษาอีสานเป็นข้อความสำหรับการสร้างชุดข้อมูลเพื่องานด้านเทคโนโลยีทางเสียง
- Isan Spelling Standard อักขรวิธีการสะกดคำภาษาอีสานด้วยอักษรไทย
- Isan Speech Corpus ชุดข้อมูลเสียงพูดภาษาอีสานจากหลายจังหวัดในภาคตะวันออกเฉียงเหนือ
- Isan Phonetic Dictionary พจนานุกรมคำอ่านที่เชื่อมโยงคำกับการออกเสียงในภาษาอีสาน
- Isan Speech Transcription Convention แนวทางการถอดเสียงภาษาอีสานเป็นข้อความสำหรับการสร้างชุดข้อมูลเพื่องานด้านเทคโนโลยีทางเสียง
- Isan Spelling Standard อักขรวิธีการสะกดคำภาษาอีสานด้วยอักษรไทย
- Isan Speech Corpus ชุดข้อมูลเสียงพูดภาษาอีสานจากหลายจังหวัดในภาคตะวันออกเฉียงเหนือ
- Isan Phonetic Dictionary พจนานุกรมคำอ่านที่เชื่อมโยงคำกับการออกเสียงในภาษาอีสาน
นอกจากนี้ยังได้ปล่อยรายงานเชิงเทคนิคที่อธิบายกระบวนการสร้างแนวทางต่าง ๆ เหล่านี้ไว้อย่างละเอียด
สิ่งที่น่าสนใจคือ ประเทศไทยยังมีความเสี่ยงจะสูญเสียภาษาไปกว่า 34%
ในวันที่เทคโนโลยีส่วนใหญ่เข้าใจแค่ “ภาษากลาง”
ในวันที่เทคโนโลยีส่วนใหญ่เข้าใจแค่ “ภาษากลาง”
โครงการ Typhoon Isan จึงไม่ใช่แค่เรื่องการสื่อสาร
แต่คือการเปลี่ยน “ภาษา” ให้กลายเป็น “โครงสร้างพื้นฐานดิจิทัล”
ที่ใช้ได้ตั้งแต่ Call Center การแพทย์ จนถึงธุรกิจท้องถิ่น
รวมถึงยังเปิดโอกาสใหม่ในโลกธุรกิจ ตั้งแต่การเงิน เกษตร ไปจนถึงบริการลูกค้า
แต่คือการเปลี่ยน “ภาษา” ให้กลายเป็น “โครงสร้างพื้นฐานดิจิทัล”
ที่ใช้ได้ตั้งแต่ Call Center การแพทย์ จนถึงธุรกิจท้องถิ่น
รวมถึงยังเปิดโอกาสใหม่ในโลกธุรกิจ ตั้งแต่การเงิน เกษตร ไปจนถึงบริการลูกค้า
ตัวอย่างเช่น ในวงการแพทย์
ระบบสามารถแปลเสียงคนไข้หรืออ่านเอกสารราชการภาษาอีสาน
ให้แพทย์รุ่นใหม่เข้าใจอาการได้ถูกบริบท
ลดความคลาดเคลื่อนในการรักษา และสร้างมาตรฐานข้อมูลเสียงเพื่อการแพทย์ไทย
ระบบสามารถแปลเสียงคนไข้หรืออ่านเอกสารราชการภาษาอีสาน
ให้แพทย์รุ่นใหม่เข้าใจอาการได้ถูกบริบท
ลดความคลาดเคลื่อนในการรักษา และสร้างมาตรฐานข้อมูลเสียงเพื่อการแพทย์ไทย
แล้วไต้ฝุ่น จาก SCB 10X เชื่อมต่อ AI ให้เข้าใจภาษาอีสาน ได้อย่างไร
ติดตามได้ในโพสต์นี้
ติดตามได้ในโพสต์นี้
#SCB10X #Typhoon #TyphoonIsan #ไต้ฝุ่นอิสาน